本学期第九期的Brown Bag于2020年5月8日在线上举行,2015届战略方向博士毕业生何文龙师兄(现就职于对外经济贸易大学)为大家带来了主题为“数据匹配与研究心得”的分享。

首先,何文龙师兄介绍了自己围绕企业创新为主题的研究兴趣与研究历程,并阐述了专利数据的重要性以及当时的研究机会。接下来,他以专利数据为例,分享了整理、清理以及匹配中国上市公司数据与公司专利数据的经验。
接下来,何文龙师兄总结了专利数据匹配的五大步骤:
Constructing corporate trees (明确每一个上市公司每一年有哪些子公司)
Extracting patent data (从SIPO购买了数据)
Choosing a matching algorithm (算法要参考以往文献)
Setting the optimal threshold (调试容错率)
Conducting manual check (人工检查)
此外,何文龙师兄还分享了匹配专利数据过程中的具体问题,使大家对专利数据有了进一步的了解。
在活动的最后,何文龙师兄就是否要自建数据库以及这一过程中可能遇到的困难给出了自己的见解。Brown Bag本学期的第九次线上活动圆满结束,祝同学们收到良好的数据、做出优质的研究!