AI工具实践|在读文科博士尝试把Stata 接进了 Claude Code,来说说我的使用感受

做过实证的我们都有这种体验

在一篇实证分析中，真正花在"想问题"上的时间可能只有三成，剩下七成耗在数据清洗、调代码、查报错、对参考文献格式这些事上。

最近我慢慢把 Claude Code 用进了自己的实证流程。

Claude Code能直接读你电脑里的文件、运行你的代码、改你的文档。

它是一个跑在终端里的 AI 助手，而"编程"这件事，对经济学研究者来说约等于"处理数据 + 跑计量 + 写稿"。

一、它和网页版聊天到底差在哪

网页版是"隔着玻璃给建议"，Claude Code 是"坐进你的项目里干活"。

它能看到你整个项目文件夹：.dta 数据、.do 脚本、Word 初稿、研究笔记；

- 它能运行命令：跑回归、装包、转文档格式；

- 它有记忆：一个叫 CLAUDE.md 的文件，你把项目规范写进去，它每次启动自动读取。

二、我尝试用的场景

① 数据清洗。

原始数据常常是几十个命名混乱、变量定义不统一 Excel。我把数据长什么样、要清成什么样描述给它，它写出清洗脚本，我审一遍再跑。比从零写省一大半时间，而且它写的代码注释比我自己写的还规整。

② 把 Stata 接进来（stata-mcp）。

这是我最想安利的一个。通过 stata-mcp 这个连接器，Claude Code 能直接调用本机 Stata：读 .dta、跑.do、把回归结果取回来。

意味着我不用在"Claude 窗口"和"Stata窗口"之间反复复制粘贴——我说"用这批数据跑个固定效应回归，被解释变量是企业研发投入"，它写代码、跑、把结果表拿回来。改设定、加控制变量，一句话的事。

③ 读文献、理综述。把一摞 PDF 丢进去，让它按主题归类、提炼每篇的识别策略和核心结论，生成带出处的文献笔记。

④ 格式与改稿。参考文献格式校验、按目标期刊体例调结构、把 Markdown 稿转成合规 Word。这种规则明确、繁琐易错的活，交给它最划算。

⑤ 拆解审稿意见。 R&R 回来，把审稿意见贴进去，让它逐条拆成"问题—涉及章节—需补的分析—回应要点"，生成一张回应清单。它不替你做研究判断，但能把一团乱麻理成行动清单。

三、一个真实的小细节：它会主动提醒我

我在项目的 CLAUDE.md 里写了一条规则：只要检测到我用 reghdfe 做多时点 DID，必须提醒我做 Goodman-Bacon 分解和异质性稳健估计量检验。

于是我跑一个交错处理的 DID，它写完代码后停下来问我："这是多时点 DID，负权重问题处理了吗？要不要顺手做

Callaway-Sant'Anna？"——这种"长在工作流里的规范"，比贴在墙上的 checklist 有用得多

四、三条红线：这些事绝对不能交给它

1. 不能编文献。 AI 编造参考文献是重灾区，作者、年份、刊名、页码它都能编得有模有样。我的规矩是：任何不确定的文献标注"待核实"，绝不让它自动补全。

2. 不能编实证结果。所有系数、t 值、样本量、R² 必须来自你真实跑出的 Stata 输出，不能让它"按经验估一个合理数值"。

3. 结果必须自己核。它写的代码会有 bug，判断会有错。把它当成"很勤快但需要你 review 的科研助理"，心态就对了。

五、给科研er的一个上手建议

别一上来追求复杂用法。第一步只做一件事：在项目文件夹里建一个

CLAUDE.md，把研究方向、常用方法规范、文件结构、绝对不能违反的红线写进去。它每次启动先读这份文件，相当于你每天给助理的"今日须知"一次写好、长期生效。

我们可以适当把一些简单的工作外包给AI，以此来提高效率，尤其是像我这种，什么都是靠自己单打独斗，分不了身，就合理借助AI当副手。