2000-2024年上市公司产学研合作(UIC)数据

张开发
2026/4/28 23:37:19 15 分钟阅读

分享文章

2000-2024年上市公司产学研合作(UIC)数据
产学研合作University-Industry Collaboration, UIC是衡量企业与高校及科研机构协同创新程度的核心指标。本数据集基于中国上市公司年度报告中披露的客户及合作方清单构建由团队依据公开披露信息测算时间覆盖20002024年。核心指标包括股票代码、年份以及产学研合作强度UIC。指标计算公式为UIC ln(1 当年披露的产学研合作方数量)。其中合作方定义为在年报客户清单或合作方章节中出现的、名称包含“大学”“学院”“学校”“研究院”“研究所”“科学院”“党校”“高校”“研究中心”等关键词的机构。每个不同的合作方去重后计为1次取自然对数以缓解偏态分布问题。该指标取值通常介于0与3.5之间部分企业因未披露客户信息或未与高校合作而取值为0数值越大表示企业与学术机构的合作越活跃能够有效刻画企业在特定年度的“产学研协同创新”程度为研究开放式创新、知识溢出与技术转化提供基础数据。基于本数据集研究者可从三方面展开实证分析。第一研究产学研合作对企业创新绩效的影响将UIC与企业专利数、新产品产值等变量匹配采用面板固定效应模型检验合作是否显著提升创新产出并探索吸收能力、融资约束的调节作用。第二分析产学研合作与政府补贴、知识溢出的互补效应结合政府RD补贴强度SUB和区域大学专利存量KS考察三螺旋Triple Helix框架下各要素的协同作用即合作是否在补贴超过阈值如营收的1.39%时产生倍增效果。第三进行异质性分析按企业产权性质国有/民营、行业制造业/服务业、地区市场化程度分组检验产学研合作效果的差异为“精准施策”提供经验证据。本数据集严格按照论文定义处理所有处理通过Pythonpandas、正则表达式编程实现确保可复现。首先进行数据提取与清洗从上市公司年报PDF或txt文件中定位“主要客户”“前五大客户”“合作伙伴”等章节提取章节文本。其次识别合作方对文本逐句扫描使用正则表达式匹配包含机构后缀如“大学”“研究院”等的中文名称并排除个人学历、项目名称等噪声例如过滤包含“毕业”“博士”“存货”“在建开发产品”的句子。然后统计去重每家公司每年出现的不同合作方名称去重后计数。最后进行对数转换计算ln(1计数)得到产学研合作强度。若年报未披露客户清单或无合作方则结果为0。输出Excel文件包含股票代码、股票简称、年份、产学研合作识别次数、产学研合作标记、产学研合作对数转换值、具体合作关联词供后续分析使用。数据指标数据展示参考文献Wang, X., Zhou, B., Guan, W., Dai, J. (2026). Triple Helix synergy at the subsidy threshold: Government support, IUR collaboration, and knowledge spillovers in enterprise AI innovation. Technological Forecasting Social Change, *227*, 124626.经管数据智能体助手https://ikzjy7.smartapps.baidu.com/?_chatParams%7B%22content_build_id%22%3A%22%22%2C%22from%22%3A%22q2a%22%2C%22token%22%3A%22G90ab9CiPkx6ZM5kWr%2Bed3VLx5IX5DPThdDlyaR7LAHyC6sId3FuU5A%2F9o4fx2o63zJkosuIeUc5hoNbJX1nU3hmGHNjDtiueVPF9Z73hPBepYGex8QGtj94uBxiVqq0jHzhWZBoiGWAGOZBduzODUY%3D%22%2C%22chat_no_login%22%3Atrue%2C%22agent_id%22%3A%22OP5phwmTXPfdDxHtjb3mTLp7TDjq7HGG%22%7Dsearchidfadc6a850001b9dd_swebScene3711001210000000

更多文章