做过实证的我们都有这种体验
在一篇实证分析中,真正花在"想问题"上的时间可能只有三成,剩下七成耗在数据清洗、调代码、查报错、对参考文献格式这些事上。
最近我慢慢把 Claude Code 用进了自己的实证流程。
Claude Code能直接读你电脑里的文件、运行你的代码、改你的文档。
它是一个跑在终端里的 AI 助手,而"编程"这件事,对经济学研究者来说约等于"处理数据 + 跑计量 + 写稿"。
一、它和网页版聊天到底差在哪
网页版是"隔着玻璃给建议",Claude Code 是"坐进你的项目里干活"。
它能看到你整个项目文件夹:.dta 数据、.do 脚本、Word 初稿、研究笔记;
- 它能运行命令:跑回归、装包、转文档格式;
- 它有记忆:一个叫 CLAUDE.md 的文件,你把项目规范写进去,它每次启动自动读取。
二、我尝试用的场景
① 数据清洗。
原始数据常常是几十个命名混乱、变量定义不统一 Excel。我把数据长什么样、要清成什么样描述给它,它写出清洗脚本,我审一遍再跑。比从零写省一大半时间,而且它写的代码注释比我自己写的还规整。
② 把 Stata 接进来(stata-mcp)。
这是我最想安利的一个。通过 stata-mcp 这个连接器,Claude Code 能直接调用本机 Stata:读 .dta、跑.do、把回归结果取回来。
意味着我不用在"Claude 窗口"和"Stata窗口"之间反复复制粘贴——我说"用这批数据跑个固定效应回归,被解释变量是企业研发投入",它写代码、跑、把结果表拿回来。改设定、加控制变量,一句话的事。
③ 读文献、理综述。 把一摞 PDF 丢进去,让它按主题归类、提炼每篇的识别策略和核心结论,生成带出处的文献笔记。
④ 格式与改稿。 参考文献格式校验、按目标期刊体例调结构、把 Markdown 稿转成合规 Word。这种规则明确、繁琐易错的活,交给它最划算。
⑤ 拆解审稿意见。 R&R 回来,把审稿意见贴进去,让它逐条拆成"问题—涉及章节—需补的分析—回应要点",生成一张回应清单。它不替你做研究判断,但能把一团乱麻理成行动清单。
三、一个真实的小细节:它会主动提醒我
我在项目的 CLAUDE.md 里写了一条规则:只要检测到我用 reghdfe 做多时点 DID,必须提醒我做 Goodman-Bacon 分解和异质性稳健估计量检验。
于是我跑一个交错处理的 DID,它写完代码后停下来问我:"这是多时点 DID,负权重问题处理了吗?要不要顺手做
Callaway-Sant'Anna?"——这种"长在工作流里的规范",比贴在墙上的 checklist 有用得多
四、三条红线:这些事绝对不能交给它
1. 不能编文献。 AI 编造参考文献是重灾区,作者、年份、刊名、页码它都能编得有模有样。我的规矩是:任何不确定的文献标注"待核实",绝不让它自动补全。
2. 不能编实证结果。 所有系数、t 值、样本量、R² 必须来自你真实跑出的 Stata 输出,不能让它"按经验估一个合理数值"。
3. 结果必须自己核。 它写的代码会有 bug,判断会有错。把它当成"很勤快但需要你 review 的科研助理",心态就对了。
五、给科研er的一个上手建议
别一上来追求复杂用法。第一步只做一件事:在项目文件夹里建一个
CLAUDE.md,把研究方向、常用方法规范、文件结构、绝对不能违反的红线写进去。它每次启动先读这份文件,相当于你每天给助理的"今日须知"一次写好、长期生效。
我们可以适当把一些简单的工作外包给AI,以此来提高效率,尤其是像我这种,什么都是靠自己单打独斗,分不了身,就合理借助AI当副手。
夜雨聆风