
一起读文献

企业的“人工智能水平”究竟该如何衡量?用什么指标才能让审稿人信服?内生性问题又该如何处理?本文提炼出AI研究中最核心的工具:代理指标与工具变量。感谢阅读与关注!
学术帮帮社团
导航

一、六类AI代理指标


方法一:企业AI专利数量(最主流之一)
核心逻辑:专利是企业技术研发成果的直接体现,AI专利数量反映了企业在人工智能领域的技术积累。
识别方式:
IPC分类号法:依据《关键数字技术专利分类体系(2023)》筛选AI相关IPC分类号
大语言模型法(BERT) :利用BERT等模型对专利摘要进行语义识别和分类
推荐文献:何小钢等(《数量经济技术经济研究》2026年第5期)、李玉花等(《中国工业经济》2024年第10期)、黄远浙等(《东南大学学报》2026年第2期)
方法二:年报文本分析法(应用最广泛)
核心逻辑:上市公司年报,尤其是“管理层讨论与分析”(MD&A)部分,会披露企业的AI战略与实际应用情况。
技术演进:
1.0 词典法:构建AI关键词词典,统计词频
2.0 机器学习法(Word2vec) :基于种子词扩展生成更全面的AI词典
3.0 大语言模型法(ERNIE/BERT) :对AI相关语句进行语义分类,仅保留“真实反映企业应用”的内容,有效排除策略性披露
推荐文献:姚加权等(《管理世界》2024年第2期)、董萍(《财经研究》2026年第5期)、付业辉等(《科技进步与对策》2026年第8期)
方法三:企业AI渗透度(任务法)
核心逻辑:利用美国职业信息网络(O*NET)数据计算各职业的AI渗透度,再以企业员工职业结构为权重,加总至企业层面。
推荐文献:陈琳等(《管理世界》2024年第6期)
方法四:准自然实验(政策冲击)
核心逻辑:将国家AI相关政策试点作为外生冲击,构建双重差分模型(DID)。
推荐文献:权小锋、李静蕾(《世界经济》2025年第8期)、张清燕、杨兴全(《上海财经大学学报》2025年第5期)
方法五:工业机器人密度
核心逻辑:利用IFR提供的行业机器人安装数据,除以行业员工数。
推荐文献:吕越等(《中国工业经济》2020年第5期)
方法六:AI相关招聘广告
核心逻辑:通过识别企业招聘的AI相关岗位数量,反映其对AI人才的需求。
推荐文献:姚加权等(《管理世界》2024年第2期)


二、五类工具变量


类型一:Bartik工具变量(应用最广)
核心思路:用“初始份额 × 总体增长率”构造外生预测值。
基本公式:IV = 企业初始AI水平 × 全样本整体增长率
优势:宏观增长率不受单个企业决策影响,有效切断反向因果。
推荐文献:何小钢等(2026)、李玉花等(2024)
类型二:历史/地理变量 × 宏观趋势
核心思路:用外生的历史或地理特征“搭乘”当代宏观趋势。

类型三:行业/同行平均水平
核心思路:同一行业其他企业的AI平均水平影响本企业,但与单个企业的结果变量不直接相关。
推荐文献:陈琳等(《管理世界》2024)
类型四:宏观政策冲击
核心思路:利用国家政策文件作为外生冲击,构建广义DID。
推荐文献:陈琳等(《管理世界》2024,利用2017年《新一代人工智能发展规划》)
类型五:构建性工具变量
核心思路:利用解释变量的函数变换构建IV,如“行业-省份AI水平差额的三次方”。
推荐文献:付业辉等(《科技进步与对策》2026)


三、方法选择建议





欢迎关注我们




往期回顾


2026年JCR期刊分区正式发布:颠覆与争议中的科研评价新秩序
2026年度教育部人文社科一般项目申报启动!六大重点方向,7月12日截止

夜雨聆风