
AI辅助科研不能停留在“总结文献、润色文字、修改代码”三个零散动作上。真正高效的做法,是把AI嵌入科研的完整链条:
研究问题识别—文献筛选—数据构建—识别设计—实证分析—论文写作—审稿修改。
1. 文献阶段:从“总结论文”升级为“建立证据矩阵”
AI最基础的用法,是概括一篇论文讲了什么。但博士研究真正需要的不是摘要,而是建立文献之间的可比关系。
阅读同一主题的文献时,可以让AI按照统一维度提取:
把十几篇文献放入同一个表格后,才能看出真正的研究空间:
哪些结论已经比较稳定; 哪些结果存在分歧; 哪些机制只是理论推测; 哪些研究对象尚未覆盖; 哪些识别策略仍不充分。
因此,好的提示词不是:
帮我总结这篇文章。
而是:
请依据原文提取研究问题、样本、变量、识别策略、机制和局限,并说明这篇文献与我的研究问题之间是支持、竞争还是补充关系。无法从原文确认的内容请明确标注为推断。
AI负责提取,研究者负责比较和判断。
2. 选题阶段:建立“问题—数据—识别”三重检验
AI生成十个热点题目并不难,难的是判断题目能不能做。
一个经管实证选题至少要同时通过三道关:
第一关:问题是否成立
研究的是具体问题,还是宽泛主题? X和Y之间是否存在理论上的不确定性? 结论是否显而易见? 这个问题为什么值得重新回答?
第二关:数据是否可得
核心变量能否准确测量? 数据是企业、城市还是行业层面? 时间跨度是否覆盖政策前后? 企业名称、地区代码和年份能否匹配? 数据缺失是否具有系统性?
第三关:识别是否可信
处理组和对照组从哪里来? 政策是否可能选择性落地? 是否存在提前反应和同期政策? 标准误应在哪个层级聚类? 研究设计能识别因果效应,还是只能说明相关关系?
可以让AI扮演匿名审稿人:
我的研究问题是X对Y的影响,样本为____,拟采用____方法。请分别从理论贡献、数据可得性、变量测量和因果识别四个方面指出最可能导致论文失败的问题,不要替我美化选题。
AI在这一环节最有价值的功能,不是提供灵感,而是帮助研究者尽早排除不可行方案。
3. 数据阶段:先建立数据字典,再让AI协助写代码
很多博士生拿到数据后立即跑回归,结果后期不断返工。
更规范的流程应该是先建立数据字典:
完成变量定义后,再让AI协助:
编写数据清洗代码; 检查重复观测; 统一企业代码和日期格式; 生成描述性统计; 排查Stata、R或Python报错; 为每段代码添加注释。
向AI提问时,要给足上下文:
数据层级是企业—年份,企业代码为字符串,年份为数值型。目前需要将政策名单与财务面板合并。请先列出应检查的唯一标识、重复值和匹配失败原因,再给出代码,不要假设企业名称完全一致。
这样得到的代码才更接近真实科研任务。
4. 实证阶段:让AI检查识别,而不是只解释显著性
AI最容易做的是解释回归系数,但这也是风险最大的环节。
一个系数显著,不代表因果关系成立。研究者首先要回答:
处理是否外生; 平行趋势是否成立; 是否存在选择性进入; 是否遗漏同期政策; 是否存在反向因果; 结果是否由少量极端样本驱动。
因此,回归完成后,应让AI按照“审稿质疑—对应检验”建立清单:
可以使用这样的提示词:
请以严格的经管期刊审稿人身份,检查以下研究设计。不要只建议增加更多稳健性检验,而要说明每项检验具体回应哪一种识别威胁,以及哪些检验即使显著也不能解决核心内生性。
真正高质量的AI辅助,不是帮论文“多做几张表”,而是帮助研究者判断每张表有没有识别意义。

5. 机制阶段:先提出可证伪预测,再找变量
机制研究最常见的误区,是先看数据库里有什么变量,再倒推一个理论故事。
更规范的顺序应该是:
理论机制 → 可观察预测 → 变量代理 → 经验检验。
例如,假设智算中心通过降低计算成本促进企业探索式创新,那么至少应观察到:
智算资源可得性提高; 企业数字技术应用或研发活动增加; 企业进入新的技术领域; 这种作用在算力依赖程度更高的企业中更强。
这些都是可以被数据否定的预测。
如果只能发现“智算中心影响研发投入”,却无法说明研发投入为何代表算力使用渠道,那么机制证据仍然较弱。
AI可以帮助研究者寻找替代解释:
我认为X通过M影响Y。请提出至少五种竞争机制,并分别说明:理论逻辑、可观测预测、可使用变量以及如何区分这些机制。
机制分析的目标不是证明唯一渠道,而是构建一组相互支持的证据。
6. 写作阶段:建立“主张—证据”对应关系
经管论文写作不是把结果表翻译成文字,而是围绕核心主张组织证据。
每一节写完后,都可以建立一张对应表:
AI可以检查:
文字结论是否超过证据范围; 是否把相关性写成因果性; 是否把“不拒绝原假设”写成“证明没有影响”; 是否用机制回归过度宣称“机制成立”; 是否将异质性结果解释成一般规律。
一个更专业的提示词是:
请逐句检查以下结果分析,标出所有超过经验结果支持范围的表述,并将“证明、导致、完全通过”等强因果措辞改为与识别强度相匹配的表达。
7. 修改阶段:把导师和审稿意见转化为任务矩阵
收到修改意见后,不要立即逐条改文字。先识别意见背后的问题类型:
理论问题; 文献定位问题; 数据问题; 识别问题; 机制问题; 结果解释问题; 表达和格式问题。
可以建立修改矩阵:
例如,审稿人提出“专精特新认定可能具有选择性”,这不是补一句局限性就能解决的问题,而是涉及:
企业为何被认定; 认定前趋势是否相同; 可观测特征是否平衡; 是否存在反向选择; 是否需要调整识别策略。
AI可以协助拆解意见,但不能替研究者决定应该接受还是反驳。
一套适合经管博士的最小AI组合
工具不宜过多,能跑通流程最重要。
不要让同一种内容在五个软件中各存一份。建议明确:
Zotero保存原文,Obsidian保存自己的判断,论文项目保存最终分析,AI对话只作为临时工作空间。
最后
博士生使用AI的专业分水岭,不是会不会写提示词,而是是否知道:
哪些工作可以自动化; 哪些判断不能外包; 哪些结果必须回到原始数据和原文核验; 哪些表述超过了证据能够支持的范围。
AI可以显著降低文献整理、代码排错和结构检查的时间成本,但不能替代研究问题、识别设计和学术责任。
真正成熟的AI科研工作流应该是:
AI负责提高处理信息的速度,研究者负责决定什么信息值得相信。
夜雨聆风