最近,我们做了一个帮助实证经济学家补齐理论版图的 Claude Code Skill:pAI-Econ-claude。
目前已涵盖微观经济学通用经典模型、IO、劳动经济学、国际贸易等数十种理论模型的建模、推导与拓展。

用法简单来说就是在安装 /theoretical-economics-claude-skill 后,在 Claude Code 中输入建模要求:

最终 CC 会生成 pdf 版理论模型报告:

需要强调的是,这不是一个面向纯小白的一键生成经济学理论模型推导工具。该 Skill 只适合已经具有一定经济学训练、能够判断模型是否合理、也能识别 AI 输出局限的研究者。
完整使用视频演示如下(用时约30分钟,所用LLM为Sonnet 4.6,token用量约为Pro一个5小时session的75%):项目开源地址:
https://github.com/maxwell2732/pAI-Econ-claude/
以下为项目说明文档:

pAI-Econ-claude
一个连接经济学实证发现与理论建模的 Claude Code SkillpAI-Econ-claude 并不试图替代理论经济学家的原创工作,而是帮助实证研究者把经验现象、机制直觉和实证发现转化为更清晰的理论问题、经典模型参照、可检验命题和可审计的研究框架。
English Version · 快速开始 · 使用场景 · 理论模型库 · 工作流
pAI stands for principal Agentic Investigator (Abdelmoneum, Beneventano, & Poggio, 2026).
作者与更新
作者:
Chen Zhu / 朱晨(China Agricultural University | 遗传社科研究)
Xiaolu Wang / 王晓璐(China Agricultural University)
Weilong Zhang / 章维龙(University of Cambridge)
最后更新: 2026 年 6 月 15 日 ( 测试版 )
致谢与来源
本项目受 pAI/MSc 启发,并基于其 research pipeline 思想改造为理论经济学方向的 Claude Code Skill。
Original pAI/MSc:
Mahmoud Abdelmoneum Pierfrancesco Beneventano Tomaso Poggio MIT + Perseus Labs
Reference:
pAI/MSc: ML Theory Research with Humans on the Loop PoggioAI_MSc GitHub Repository
反馈与优化: Gin
项目简介
pAI-Econ-claude 是一个面向实证经济学家的 human-in-the-loop Claude Code Skill,旨在帮助研究者从经验现象、机制直觉和实证发现出发,补齐研究中的理论版图。
它并不试图替代理论经济学家的原创工作,也不声称能够自动发现新的理论前沿。相反,它的定位是作为理论与实证之间的桥梁:帮助实证研究者识别合适的经典模型家族,澄清核心经济机制,明确模型扩展相对于既有理论的新增部分,并将经验问题转化为更规范的理论表述。
很多实证研究并不缺少数据、识别策略或估计结果,真正薄弱的地方往往是理论机制不够清楚:为什么这个现象应该成立?它对应哪个经典模型?新增变量改变了什么?命题是否只是由假设直接推出?福利含义是否超过了估计结果本身?
pAI-Econ-claude 试图为这些问题提供一个结构化工作流。它通过典范模型匹配、理论谱系检查、模型原语生成、假设审计、候选命题、证明草图和反例检查,帮助研究者把一个 empirical puzzle 转化为可讨论、可审查、可进一步合作发展的理论框架。
换句话说,它不是 AI 理论经济学家,而是一个面向实证研究者的理论建模脚手架:
帮助你知道自己的经验发现可以放进哪个理论传统里、还缺少哪一块机制、应该向理论合作者提出什么样的问题。
它解决什么问题?
经济学研究里的理论分析部分常常不是卡在"不会写",而是卡在更早的阶段:
研究问题是否真的清楚? 这个想法应该放在哪个经典模型传统里? 新机制相对于经典模型到底新增了什么? 假设是否过强,是否只是为了推出想要的结论? 命题是否非平凡,还是由假设直接推出? 证明草图有哪些缺口? 是否存在简单反例? 经济学解释是否超过了形式结果本身?
pAI-Econ-claude 的定位是帮助研究者把理论建模过程显性化、文档化、可回溯化,并在关键节点保留人类判断。
目标用户与使用责任
目标用户
本 Skill 的设计目标用户是具备经济学理论基础的初级研究者,包括:
经济学、管理学等相关方向的研究生(硕士、博士) 以实证研究为主、希望补齐理论机制的助理教授或博士后 熟悉微观经济学基础(效用最大化、均衡概念、信息结构)的研究者
使用本 Skill 要求用户具备以下基本能力:
能够独立判断一个均衡概念(如 BNE、SPE、竞争均衡)是否适合当前研究设定 能够识别一个命题是否非平凡,或仅由假设直接推出 能够评估一个理论机制是否与实证识别策略存在有意义的对应关系
本 Skill 不面向对经济学理论建模完全陌生的研究者。 如果用户无法独立判断 AI 生成的模型结构和命题的质量,则无法对输出结果承担应有的学术责任。
使用责任
使用者对最终发表成果负完全责任。
本 Skill 是一个辅助工具,其输出(包括模型原语、命题、证明草图、论文框架和参考文献)均须经过使用者独立审核,方可用于任何学术写作和发表目的。
具体而言:
- Proof sketch 不是正式证明
标注为 GAP或FALSE_RISK的步骤须由研究者自行推导和验证,不得在未经核实的情况下写入论文 - 文献引用须独立核查
虽然 Stage 2 和 PDF 生成前均设有联网验证节点,但研究者仍须对最终发表的引用列表的准确性负责 - 理论贡献须研究者判断
AI 无法最终裁定一个命题是否具有足够的创新性以满足期刊要求,这一判断须由研究者和合作者在充分理解领域文献的基础上做出 - 模型选择须研究者评估
Canonical Model Matching 的建议仅供参考,研究者须根据自身对相关文献传统的理解做出最终选择
本项目及其作者不对使用本 Skill 生成的任何内容在学术发表中的准确性、原创性或充分性承担责任。
快速开始
安装
git clone https://github.com/maxwell2732/pAI-Econ-claude.gitcd pAI-Econ-claude
在该目录下打开 Claude Code,slash command 即自动可用:
/theoretical-economics-claude-skill "你的理论经济学研究想法"使用场景
pAI-Econ-claude 支持不同成熟度的理论想法。你不必每次都跑完整 pipeline,可以根据任务选择合适入口。
1. Model Extension Mode:从经典模型出发做机制扩展
当你已经知道大致模型家族,希望加入一个新机制时,可以使用这个模式。
例如:
/theoretical-economics-claude-skill "mode: model_extensionExtend a search model by adding product healthfulness and costly attention to nutrition labels.Can a front-of-package label increase the probability that consumers choose healthier food?"Skill 会帮助你回答:
这个想法继承了哪个经典 search model? 新增的 healthfulness 机制改变了什么? 消费者什么时候会主动查看营养标签? 降低信息成本是否一定提高健康食品购买概率? 是否存在反例或边界情形? 这个扩展是否有足够理论贡献?
2. Phenomenon-to-Model Mode:从经济现象匹配理论模型
当你有一个现象或机制直觉,但不确定该用什么理论模型时,可以使用这个模式。
例如:
/theoretical-economics-claude-skill "mode: phenomenon_to_modelI want to incorporate genetic endowment into a health capital framework.Genetic endowment affects productivity through childhood environment, health investment,and human capital formation. Which theoretical model is most suitable?"Skill 会比较多个候选模型家族,例如:
Grossman health capital model Becker / Ben-Porath human capital investment model Cunha-Heckman skill formation framework Roy model of comparative advantage lifecycle investment model intergenerational human capital model
然后推荐一个 baseline model,并解释其他模型为什么适合或不适合。
3. Model Critique Mode:审查已有理论模型
如果你已经有模型原语、假设或命题,可以让 Skill 像理论经济学 referee 一样进行审查。
/theoretical-economics-claude-skill "mode: model_critiqueHere is my model setup:[粘贴模型原语、时序、效用函数、均衡定义和命题]Please audit model coherence, assumptions, non-triviality, proof gaps, and possible counterexamples."它会重点检查:
模型是否闭合? 时序是否清楚? 信息结构是否完整? 均衡概念是否合适? 假设是否只是为了推出想要的结论? 命题是否非平凡? 证明草图是否存在跳步? 是否存在 2-agent、2-period、binary-action 的简单反例?
4. Full Pipeline Mode:从研究想法跑完整理论工作流
当你只有一个早期想法,希望从 intuition 一直推进到论文框架时,可以使用完整流程。
/theoretical-economics-claude-skill "mode: full_pipelineInvestigate whether a principal facing a privately informed agent can achieve first-best efficiencythrough a forcing contract when the agent's outside option is type-dependent."完整输出包括:
refined research puzzle literature positioning plan canonical model match model primitives assumption audit candidate propositions proof sketches counterexamples economic interpretation manuscript skeleton(含 LaTeX 源文件和学术格式 PDF,pdflatex 编译)
5. Manuscript Skeleton Only:只生成论文框架
当模型、命题和主要结论已经比较清楚,只需要整理成 working paper 结构时,可以使用这个模式。
/theoretical-economics-claude-skill "mode: manuscript_skeleton_onlyHere are my model, propositions, and proof sketches:[粘贴已有内容]Please organize them into a theoretical economics working paper skeleton."核心阶段
research_intake.md | ||
research_puzzle.md | ||
literature_positioning.md | ||
persona_council.md | ||
canonical_model_match.md | ||
model_primitives.md | ||
assumption_audit.md | ||
candidate_propositions.md | ||
proof_sketches.md | ||
counterexamples_and_edge_cases.md | ||
economic_interpretation.md | ||
manuscript_skeleton.mdmanuscript_skeleton.tex + manuscript_skeleton.pdf |
理论模型库
pAI-Econ-claude 内置一个 model_library/,用于在建模前先匹配经典理论模型家族。
这一步非常重要,因为理论经济学研究不应该从零开始"凭空造模型",而应先回答:
当前研究想法最接近哪个经典模型?它继承了什么?改变了什么?新增机制在哪里?
通用理论模型库
产业组织(IO)专题库
国际贸易专题库
人力资本与劳动经济学专题库
针对人力资本、教育、劳动市场、自动化和 AI 影响,Skill 还内置了专题模型库(均为具备均衡概念和可证命题的结构理论模型)。
质量控制 Gates
Skill 内置多个质量门,用来避免"看起来像理论,其实没有理论贡献"的问题。
Gate 失败不会被自动隐藏,也不会被包装成通过。Skill 会明确输出:
failure reason severity recommended loopback stage whether a human override is possible
人类在环检查点
理论经济学中的关键判断不应由 agent 自动决定。因此 Skill 设置了多个必须由研究者确认的节点。
其中 HiL-4 是 hard stop。均衡概念,例如 Nash、SPE、BNE、PBE、competitive equilibrium 等,必须由研究者确认后才能进入下一阶段。
五个理论评审 Persona
在 Persona Council 阶段,Skill 会模拟五类理论经济学评审者进行两轮讨论。
Brutal Skeptic 的作用不是支持项目,而是专门攻击它。如果一个想法能经受住这个 persona 的质疑,才更值得继续推进。
输出结构
每次运行的产出统一存放在 Exploration/ 目录下,按项目编号和模型简写命名:
Exploration/└── Project_NNN_<ModelAbbrev>/ ← 例:Project_001_HumanCapitalAutomation ├── state.json ├── initial_context/ │ └── hypothesis.md ├── outputs/ │ ├── research_intake.md │ ├── research_puzzle.md │ ├── literature_positioning.md │ ├── persona_council.md │ ├── canonical_model_match.md │ ├── model_primitives.md │ ├── assumption_audit.md │ ├── candidate_propositions.md │ ├── proof_sketches.md │ ├── counterexamples_and_edge_cases.md │ ├── economic_interpretation.md │ ├── manuscript_skeleton.md │ ├── manuscript_skeleton.tex ← LaTeX 源文件(pdflatex + Computer Modern) │ └── manuscript_skeleton.pdf ← 学术排版 PDF(pdflatex + Computer Modern) ├── gates/ │ ├── gate-01-novelty-risk.md │ ├── gate-02b-canonical-fit.md │ ├── gate-02c-theory-lineage.md │ ├── gate-02-model-coherence.md │ ├── gate-03-non-triviality.md │ ├── gate-04-proof-integrity.md │ └── gate-05-economic-meaning.md └── logs/ └── stage-log.md设计原则
1. 人类在环,而不是全自动研究
理论经济学研究中的核心判断,例如研究问题是否有意义、均衡概念是否合适、命题是否值得推进、反例是否致命,必须由研究者决定。
AI 可以辅助生成、审查和反驳,但不应替代研究者做不可逆判断。
2. 先匹配经典模型,再构造新模型
Skill 在正式定义模型原语之前,会先经过 Canonical Model Matching。
这一步强制回答:
最接近的经典模型是什么? 当前模型继承了哪些结构? 新增机制是什么? 新结果是否不可由经典模型直接推出?
这可以减少"经典模型换皮"的风险。
3. 诚实标注不确定性
Proof Sketch 阶段不会把草图包装成严格证明。每个证明步骤会被标注为:
SOLIDPLAUSIBLEGAPFALSE_RISK
这使研究者可以清楚看到哪些地方已经比较稳,哪些地方还只是 conjecture-level。
4. 主动寻找反例
Stage 8 专门寻找反例和边界情形,包括:
2-agent case 2-period case binary-action case corner solution alternative equilibrium violation of key assumptions
这一步的目标不是让模型更好看,而是尽早发现它可能失败在哪里。
项目结构
pAI-Econ-claude/├── SKILL.md # 流水线编排:阶段路由、Gate 逻辑、HiL 协议├── CLAUDE.md # 项目级规则(文献验证要求、PDF 格式标准等)├── README.md # 中文说明(本文件)├── README_EN.md # 英文说明├── THEORETICAL_ECON_MIGRATION_PLAN.md # 从 pAI/MSc 迁移的设计记录├── LICENSE├── .claude/│ └── commands/│ └── theoretical-economics-claude-skill.md # slash command 入口├── model_library/ # 理论经济学典范模型库(仅结构模型)│ ├── consumer-choice.md│ ├── indirect-utility-expenditure-minimization.md│ ├── discrete-choice-random-utility.md│ ├── search-models.md│ ├── costly-information-acquisition.md│ ├── rational-inattention.md│ ├── signaling.md│ ├── screening.md│ ├── moral-hazard.md│ ├── adverse-selection.md│ ├── hotelling-product-differentiation.md│ ├── disclosure-persuasion-information-design.md│ ├── mechanism-design.md│ ├── matching-models.md│ ├── social-learning-information-cascades.md│ ├── dynamic-optimization-bellman.md│ ├── overlapping-generations-life-cycle.md│ ├── principal-agent.md│ ├── general-equilibrium-basics.md│ ├── political-economy-collective-choice.md│ ├── comparative-advantage-ricardian.md│ ├── heckscher-ohlin.md│ ├── new-trade-theory-krugman.md│ ├── melitz-firm-heterogeneity.md│ ├── io/│ │ ├── oligopoly-competition.md│ │ ├── entry-deterrence.md│ │ ├── two-sided-markets-platforms.md│ │ └── price-discrimination.md│ └── human_capital_and_labor/│ ├── becker-human-capital.md│ ├── ben-porath-lifecycle.md│ ├── roy-model.md│ ├── cunha-heckman-skill-formation.md│ ├── technology-of-skill-formation.md│ ├── self-productivity-dynamic-complementarity.md│ ├── early-childhood-investment.md│ ├── intergenerational-transmission.md│ ├── education-credit-constraints.md│ ├── occupational-choice-comparative-advantage.md│ ├── task-based-production-acemoglu-restrepo.md│ ├── automation-displacement-reinstatement.md│ ├── human-capital-adaptation-automation-ai.md│ └── directed-technical-change-sbtc.md├── prompts/│ ├── 00-intake.md│ ├── 01-puzzle-refinement.md│ ├── 02-literature-positioning.md│ ├── 03-persona-council.md│ ├── 03b-canonical-model-match.md│ ├── 04-model-primitives.md│ ├── 05-assumption-audit.md│ ├── 06-proposition-generator.md│ ├── 07-proof-sketch.md│ ├── 08-counterexample-finder.md│ ├── 09-economic-interpretation.md│ ├── 10-manuscript-skeleton.md│ ├── gate-01-novelty-risk.md│ ├── gate-02b-canonical-fit.md│ ├── gate-02c-theory-lineage.md│ ├── gate-02-model-coherence.md│ ├── gate-03-non-triviality.md│ ├── gate-04-proof-integrity.md│ └── gate-05-economic-meaning.md├── templates/│ ├── state.json│ ├── academic-econ.latex # 旧版 PDF 模板(已弃用,现直接写 .tex)│ ├── author_style_guide_econ.md│ └── author_style_guide_default.md└── Exploration/ # 所有项目工作区(自动生成,不提交内容) └── Project_NNN_<ModelAbbrev>/适用与不适用
适用
理论经济学早期构思 经典模型扩展 机制建模 人力资本、劳动经济学、信息经济学、产业组织、行为经济学等理论问题 工作论文初步框架 命题和 proof sketch 的审查 反例与边界情形检查
不适用
真实数据清洗与实证分析 自动完成严格数学证明 自动确认文献 novelty 自动生成可直接投稿的论文 替代研究者做理论判断
已知限制
文献验证需要研究者参与Stage 2 会通过联网搜索核查拟引用文献的真实性,但 researcher 仍需自行判断文献定位是否准确、最新文献是否已被覆盖。LLM 生成的引用可能存在幻觉(作者、标题、期刊看似真实但细节有误),Stage 2 和 PDF 生成前均设有强制验证节点。
Proof sketch 不是正式证明标记为
GAP或FALSE_RISK的部分必须由研究者进一步推导。模型库不是百科全书
model_library/是建模模板库,不是完整教材。模型库仅收录具有经济均衡概念和可证命题的结构模型,计量识别框架(如 MTE、Heckman Selection)不在其中。理论贡献需要研究者判断Gate 可以提示 novelty risk,但不能最终决定论文贡献。
Contributing
欢迎围绕以下方向提交改进:
auction theory、macro、IO、political economy 等专题模型库 更严格的 proof integrity gate 更丰富的 counterexample templates 更多 manuscript PDF 模板样式 explore mode:多轮理论模型空间探索
基本流程:
1. Fork this repository2. Edit prompt files, model_library, or SKILL.md routing logic3. Test on a research hypothesis end-to-end4. Submit a PR describing what changed and whyLicense
MIT License.
Copyright © 2026 Chen Zhu, Xiaolu Wang, Weilong Zhang.
Based on pAI/MSc by Mahmoud Abdelmoneum, Pierfrancesco Beneventano, and Tomaso Poggio.
夜雨聆风