【AI学术工具】我们做了一个经济学理论建模与推导的 Claude Code Skill:pAI-Econ-claude 现已公开

最近，我们做了一个帮助实证经济学家补齐理论版图的 Claude Code Skill：pAI-Econ-claude。

目前已涵盖微观经济学通用经典模型、IO、劳动经济学、国际贸易等数十种理论模型的建模、推导与拓展。

用法简单来说就是在安装 /theoretical-economics-claude-skill 后，在 Claude Code 中输入建模要求：

最终 CC 会生成 pdf 版理论模型报告：

需要强调的是，这不是一个面向纯小白的一键生成经济学理论模型推导工具。该 Skill 只适合已经具有一定经济学训练、能够判断模型是否合理、也能识别 AI 输出局限的研究者。

完整使用视频演示如下（用时约30分钟，所用LLM为Sonnet 4.6，token用量约为Pro一个5小时session的75%）：

项目开源地址：

https://github.com/maxwell2732/pAI-Econ-claude/

以下为项目说明文档：

pAI-Econ-claude

一个连接经济学实证发现与理论建模的 Claude Code SkillpAI-Econ-claude 并不试图替代理论经济学家的原创工作，而是帮助实证研究者把经验现象、机制直觉和实证发现转化为更清晰的理论问题、经典模型参照、可检验命题和可审计的研究框架。

English Version · 快速开始 · 使用场景 · 理论模型库 · 工作流

pAI stands for principal Agentic Investigator (Abdelmoneum, Beneventano, & Poggio, 2026).

作者与更新

作者：

Chen Zhu / 朱晨（China Agricultural University | 遗传社科研究）

Xiaolu Wang / 王晓璐（China Agricultural University）

Weilong Zhang / 章维龙（University of Cambridge）

最后更新： 2026 年 6 月 15 日 ( 测试版 )

致谢与来源

本项目受 pAI/MSc 启发，并基于其 research pipeline 思想改造为理论经济学方向的 Claude Code Skill。

Original pAI/MSc:

Mahmoud Abdelmoneum
Pierfrancesco Beneventano
Tomaso Poggio
MIT + Perseus Labs

Reference:

pAI/MSc: ML Theory Research with Humans on the Loop
PoggioAI_MSc GitHub Repository

反馈与优化: Gin

项目简介

pAI-Econ-claude 是一个面向实证经济学家的 human-in-the-loop Claude Code Skill，旨在帮助研究者从经验现象、机制直觉和实证发现出发，补齐研究中的理论版图。

它并不试图替代理论经济学家的原创工作，也不声称能够自动发现新的理论前沿。相反，它的定位是作为理论与实证之间的桥梁：帮助实证研究者识别合适的经典模型家族，澄清核心经济机制，明确模型扩展相对于既有理论的新增部分，并将经验问题转化为更规范的理论表述。

很多实证研究并不缺少数据、识别策略或估计结果，真正薄弱的地方往往是理论机制不够清楚：为什么这个现象应该成立？它对应哪个经典模型？新增变量改变了什么？命题是否只是由假设直接推出？福利含义是否超过了估计结果本身？

pAI-Econ-claude 试图为这些问题提供一个结构化工作流。它通过典范模型匹配、理论谱系检查、模型原语生成、假设审计、候选命题、证明草图和反例检查，帮助研究者把一个 empirical puzzle 转化为可讨论、可审查、可进一步合作发展的理论框架。

换句话说，它不是 AI 理论经济学家，而是一个面向实证研究者的理论建模脚手架：

帮助你知道自己的经验发现可以放进哪个理论传统里、还缺少哪一块机制、应该向理论合作者提出什么样的问题。

它解决什么问题？

经济学研究里的理论分析部分常常不是卡在"不会写"，而是卡在更早的阶段：

研究问题是否真的清楚？
这个想法应该放在哪个经典模型传统里？
新机制相对于经典模型到底新增了什么？
假设是否过强，是否只是为了推出想要的结论？
命题是否非平凡，还是由假设直接推出？
证明草图有哪些缺口？
是否存在简单反例？
经济学解释是否超过了形式结果本身？

pAI-Econ-claude 的定位是帮助研究者把理论建模过程显性化、文档化、可回溯化，并在关键节点保留人类判断。

目标用户与使用责任

目标用户

本 Skill 的设计目标用户是具备经济学理论基础的初级研究者，包括：

经济学、管理学等相关方向的研究生（硕士、博士）
以实证研究为主、希望补齐理论机制的助理教授或博士后
熟悉微观经济学基础（效用最大化、均衡概念、信息结构）的研究者

使用本 Skill 要求用户具备以下基本能力：

能够独立判断一个均衡概念（如 BNE、SPE、竞争均衡）是否适合当前研究设定
能够识别一个命题是否非平凡，或仅由假设直接推出
能够评估一个理论机制是否与实证识别策略存在有意义的对应关系

本 Skill 不面向对经济学理论建模完全陌生的研究者。 如果用户无法独立判断 AI 生成的模型结构和命题的质量，则无法对输出结果承担应有的学术责任。

使用责任

使用者对最终发表成果负完全责任。

本 Skill 是一个辅助工具，其输出（包括模型原语、命题、证明草图、论文框架和参考文献）均须经过使用者独立审核，方可用于任何学术写作和发表目的。

具体而言：

Proof sketch 不是正式证明
标注为 GAP 或 FALSE_RISK 的步骤须由研究者自行推导和验证，不得在未经核实的情况下写入论文
文献引用须独立核查
虽然 Stage 2 和 PDF 生成前均设有联网验证节点，但研究者仍须对最终发表的引用列表的准确性负责
理论贡献须研究者判断
AI 无法最终裁定一个命题是否具有足够的创新性以满足期刊要求，这一判断须由研究者和合作者在充分理解领域文献的基础上做出
模型选择须研究者评估
Canonical Model Matching 的建议仅供参考，研究者须根据自身对相关文献传统的理解做出最终选择

本项目及其作者不对使用本 Skill 生成的任何内容在学术发表中的准确性、原创性或充分性承担责任。

快速开始

安装

git clone https://github.com/maxwell2732/pAI-Econ-claude.gitcd pAI-Econ-claude

在该目录下打开 Claude Code，slash command 即自动可用：

/theoretical-economics-claude-skill "你的理论经济学研究想法"

使用场景

pAI-Econ-claude 支持不同成熟度的理论想法。你不必每次都跑完整 pipeline，可以根据任务选择合适入口。

1. Model Extension Mode：从经典模型出发做机制扩展

当你已经知道大致模型家族，希望加入一个新机制时，可以使用这个模式。

例如：

/theoretical-economics-claude-skill "mode: model_extensionExtend a search model by adding product healthfulness and costly attention to nutrition labels.Can a front-of-package label increase the probability that consumers choose healthier food?"

Skill 会帮助你回答：

这个想法继承了哪个经典 search model？
新增的 healthfulness 机制改变了什么？
消费者什么时候会主动查看营养标签？
降低信息成本是否一定提高健康食品购买概率？
是否存在反例或边界情形？
这个扩展是否有足够理论贡献？

2. Phenomenon-to-Model Mode：从经济现象匹配理论模型

当你有一个现象或机制直觉，但不确定该用什么理论模型时，可以使用这个模式。

例如：

/theoretical-economics-claude-skill "mode: phenomenon_to_modelI want to incorporate genetic endowment into a health capital framework.Genetic endowment affects productivity through childhood environment, health investment,and human capital formation. Which theoretical model is most suitable?"

Skill 会比较多个候选模型家族，例如：

Grossman health capital model
Becker / Ben-Porath human capital investment model
Cunha-Heckman skill formation framework
Roy model of comparative advantage
lifecycle investment model
intergenerational human capital model

然后推荐一个 baseline model，并解释其他模型为什么适合或不适合。

3. Model Critique Mode：审查已有理论模型

如果你已经有模型原语、假设或命题，可以让 Skill 像理论经济学 referee 一样进行审查。

/theoretical-economics-claude-skill "mode: model_critiqueHere is my model setup:[粘贴模型原语、时序、效用函数、均衡定义和命题]Please audit model coherence, assumptions, non-triviality, proof gaps, and possible counterexamples."

它会重点检查：

模型是否闭合？
时序是否清楚？
信息结构是否完整？
均衡概念是否合适？
假设是否只是为了推出想要的结论？
命题是否非平凡？
证明草图是否存在跳步？
是否存在 2-agent、2-period、binary-action 的简单反例？

4. Full Pipeline Mode：从研究想法跑完整理论工作流

当你只有一个早期想法，希望从 intuition 一直推进到论文框架时，可以使用完整流程。

/theoretical-economics-claude-skill "mode: full_pipelineInvestigate whether a principal facing a privately informed agent can achieve first-best efficiencythrough a forcing contract when the agent's outside option is type-dependent."

完整输出包括：

refined research puzzle
literature positioning plan
canonical model match
model primitives
assumption audit
candidate propositions
proof sketches
counterexamples
economic interpretation
manuscript skeleton（含 LaTeX 源文件和学术格式 PDF，pdflatex 编译）

5. Manuscript Skeleton Only：只生成论文框架

当模型、命题和主要结论已经比较清楚，只需要整理成 working paper 结构时，可以使用这个模式。

/theoretical-economics-claude-skill "mode: manuscript_skeleton_onlyHere are my model, propositions, and proof sketches:[粘贴已有内容]Please organize them into a theoretical economics working paper skeleton."

核心阶段

阶段	名称	主要产出
0	Intake	`research_intake.md`
1	Puzzle Refinement	`research_puzzle.md`
2	Literature Positioning	`literature_positioning.md`
3	Theory Persona Council	`persona_council.md`
3b	Canonical Model Matching	`canonical_model_match.md`
4	Model Primitives	`model_primitives.md`
5	Assumption Audit	`assumption_audit.md`
6	Proposition Generator	`candidate_propositions.md`
7	Proof Sketch	`proof_sketches.md`
8	Counterexample Finder	`counterexamples_and_edge_cases.md`
9	Economic Interpretation	`economic_interpretation.md`
10	Manuscript Skeleton	`manuscript_skeleton.md` + `manuscript_skeleton.tex` + `manuscript_skeleton.pdf`

理论模型库

pAI-Econ-claude 内置一个 model_library/，用于在建模前先匹配经典理论模型家族。

这一步非常重要，因为理论经济学研究不应该从零开始"凭空造模型"，而应先回答：

当前研究想法最接近哪个经典模型？它继承了什么？改变了什么？新增机制在哪里？

通用理论模型库

模型家族	适用问题
Consumer Choice	消费者选择、效用最大化
Indirect Utility / Expenditure Minimization	消费者理论中的对偶问题
Discrete Choice / Random Utility	离散选择、异质偏好
Search Models	搜索成本、停止规则、信息获取
Costly Information Acquisition	注意力成本、认知成本、信息处理
Rational Inattention	有限注意力、信息容量约束
Signaling	信号传递、教育信号、质量信号
Screening	逆向选择下的机制设计
Moral Hazard	隐藏行动、激励合同
Adverse Selection	柠檬市场、质量不可观测
Hotelling / Product Differentiation	产品差异化、空间竞争
Disclosure / Persuasion	信息披露、贝叶斯劝说
Mechanism Design	显示原理、激励相容
Matching Models	双边匹配、分配市场
Social Learning	羊群行为、信息瀑布
Dynamic Optimization	Bellman 方程、生命周期选择
OLG / Life-Cycle Models	代际模型、生命周期投资
Principal-Agent	委托代理、合同设计
General Equilibrium	竞争均衡、市场出清
Political Economy	投票、集体选择、制度设计

产业组织（IO）专题库

模型家族	适用问题
Oligopoly Competition	Cournot 数量竞争、Bertrand 价格竞争、Stackelberg 先动优势
Entry Deterrence	限制性定价、产能承诺、进入阻止与进入容纳
Two-Sided Markets / Platforms	双边市场定价、网络效应、平台竞争
Price Discrimination	一二三度价格歧视、版本化、市场细分

国际贸易专题库

模型家族	适用问题
Comparative Advantage / Ricardian	比较优势、贸易专业化分工、技术差异驱动贸易
Heckscher-Ohlin	要素禀赋与贸易模式、Stolper-Samuelson、Rybczynski、要素价格均等化
New Trade Theory / Krugman (1980)	产业内贸易、规模经济、品种效应、本土市场效应
Melitz (2003) — Firm Heterogeneity	企业异质性、出口门槛、选择效应、贸易的生产率重配置收益

人力资本与劳动经济学专题库

针对人力资本、教育、劳动市场、自动化和 AI 影响，Skill 还内置了专题模型库（均为具备均衡概念和可证命题的结构理论模型）。

模型家族	适用问题
Becker Human Capital	一般与专用人力资本投资
Ben-Porath Model	生命周期人力资本积累
Roy Model	部门选择、职业选择、比较优势
Cunha-Heckman Skill Formation	技能形成、早期投资、动态互补
Technology of Skill Formation	技能生产函数（CES）
Self-Productivity & Dynamic Complementarity	技能形成的自我生产性与动态互补性
Early Childhood Investment	早期儿童发展投资与最优政策
Intergenerational Transmission	人力资本代际传递
Education under Credit Constraints	信贷约束下的教育选择
Occupational Choice & Comparative Advantage	职业选择与比较优势
Acemoglu-Restrepo Task-Based Framework	任务型生产、自动化与新任务
Automation Displacement / Reinstatement	替代效应、恢复效应、新任务创造
Human Capital Adaptation to AI	AI 冲击下的人力资本调整
Directed Technical Change / SBTC	定向技术进步与技能偏向技术变迁

质量控制 Gates

Skill 内置多个质量门，用来避免"看起来像理论，其实没有理论贡献"的问题。

Gate	名称	检查内容	失败后建议
Gate 1	Novelty Risk	问题是否可能已被文献回答	回到研究问题精炼
Gate 2b	Canonical Fit	模型家族是否匹配，是否只是经典模型换名	回到典范模型匹配
Gate 2c	Theory Lineage	是否明确理论祖先、继承内容和新增机制	回到典范模型匹配
Gate 2	Model Coherence	模型原语、时序、信息结构是否一致	回到模型原语
Gate 3	Non-triviality	命题是否非平凡，是否只是从假设直接推出	回到假设或命题
Gate 4	Proof Integrity	证明草图是否诚实标注缺口	回到命题或证明
Gate 5	Economic Meaning	经济解释是否超过形式结果	回到经济学解释

Gate 失败不会被自动隐藏，也不会被包装成通过。Skill 会明确输出：

failure reason
severity
recommended loopback stage
whether a human override is possible

人类在环检查点

理论经济学中的关键判断不应由 agent 自动决定。因此 Skill 设置了多个必须由研究者确认的节点。

检查点	位置	研究者需要决定
HiL-1	Puzzle Refinement 后	是否接受研究问题
HiL-2	Literature Positioning 后	是否接受文献定位
HiL-3	Persona Council 后	是否接受理论评审结论
HiL-4	Model Primitives 后	确认均衡概念；这是硬停点
HiL-5	Proposition Generator 后	选择哪些命题进入后续分析
HiL-6	Counterexample Finder 后	如何处理反例与边界情形

其中 HiL-4 是 hard stop。均衡概念，例如 Nash、SPE、BNE、PBE、competitive equilibrium 等，必须由研究者确认后才能进入下一阶段。

五个理论评审 Persona

在 Persona Council 阶段，Skill 会模拟五类理论经济学评审者进行两轮讨论。

Persona	关注点
Mechanism Theorist	机制是否清楚、有趣、非平凡
Mathematical Referee	模型是否可形式化，证明是否可能成立
Economic Intuition Referee	结果是否有真正经济学含义
Journal Positioning Referee	更像投向哪个理论或应用理论期刊
Brutal Skeptic	最强反对意见是什么

Brutal Skeptic 的作用不是支持项目，而是专门攻击它。如果一个想法能经受住这个 persona 的质疑，才更值得继续推进。

输出结构

每次运行的产出统一存放在 Exploration/ 目录下，按项目编号和模型简写命名：

Exploration/└── Project_NNN_<ModelAbbrev>/        ← 例：Project_001_HumanCapitalAutomation    ├── state.json    ├── initial_context/    │   └── hypothesis.md    ├── outputs/    │   ├── research_intake.md    │   ├── research_puzzle.md    │   ├── literature_positioning.md    │   ├── persona_council.md    │   ├── canonical_model_match.md    │   ├── model_primitives.md    │   ├── assumption_audit.md    │   ├── candidate_propositions.md    │   ├── proof_sketches.md    │   ├── counterexamples_and_edge_cases.md    │   ├── economic_interpretation.md    │   ├── manuscript_skeleton.md    │   ├── manuscript_skeleton.tex   ← LaTeX 源文件（pdflatex + Computer Modern）    │   └── manuscript_skeleton.pdf   ← 学术排版 PDF（pdflatex + Computer Modern）    ├── gates/    │   ├── gate-01-novelty-risk.md    │   ├── gate-02b-canonical-fit.md    │   ├── gate-02c-theory-lineage.md    │   ├── gate-02-model-coherence.md    │   ├── gate-03-non-triviality.md    │   ├── gate-04-proof-integrity.md    │   └── gate-05-economic-meaning.md    └── logs/        └── stage-log.md

设计原则

1. 人类在环，而不是全自动研究

理论经济学研究中的核心判断，例如研究问题是否有意义、均衡概念是否合适、命题是否值得推进、反例是否致命，必须由研究者决定。

AI 可以辅助生成、审查和反驳，但不应替代研究者做不可逆判断。

2. 先匹配经典模型，再构造新模型

Skill 在正式定义模型原语之前，会先经过 Canonical Model Matching。

这一步强制回答：

最接近的经典模型是什么？
当前模型继承了哪些结构？
新增机制是什么？
新结果是否不可由经典模型直接推出？

这可以减少"经典模型换皮"的风险。

3. 诚实标注不确定性

Proof Sketch 阶段不会把草图包装成严格证明。每个证明步骤会被标注为：

SOLID
PLAUSIBLE
GAP
FALSE_RISK

这使研究者可以清楚看到哪些地方已经比较稳，哪些地方还只是 conjecture-level。

4. 主动寻找反例

Stage 8 专门寻找反例和边界情形，包括：

2-agent case
2-period case
binary-action case
corner solution
alternative equilibrium
violation of key assumptions

这一步的目标不是让模型更好看，而是尽早发现它可能失败在哪里。

项目结构

pAI-Econ-claude/├── SKILL.md                              # 流水线编排：阶段路由、Gate 逻辑、HiL 协议├── CLAUDE.md                             # 项目级规则（文献验证要求、PDF 格式标准等）├── README.md                             # 中文说明（本文件）├── README_EN.md                          # 英文说明├── THEORETICAL_ECON_MIGRATION_PLAN.md    # 从 pAI/MSc 迁移的设计记录├── LICENSE├── .claude/│   └── commands/│       └── theoretical-economics-claude-skill.md  # slash command 入口├── model_library/                        # 理论经济学典范模型库（仅结构模型）│   ├── consumer-choice.md│   ├── indirect-utility-expenditure-minimization.md│   ├── discrete-choice-random-utility.md│   ├── search-models.md│   ├── costly-information-acquisition.md│   ├── rational-inattention.md│   ├── signaling.md│   ├── screening.md│   ├── moral-hazard.md│   ├── adverse-selection.md│   ├── hotelling-product-differentiation.md│   ├── disclosure-persuasion-information-design.md│   ├── mechanism-design.md│   ├── matching-models.md│   ├── social-learning-information-cascades.md│   ├── dynamic-optimization-bellman.md│   ├── overlapping-generations-life-cycle.md│   ├── principal-agent.md│   ├── general-equilibrium-basics.md│   ├── political-economy-collective-choice.md│   ├── comparative-advantage-ricardian.md│   ├── heckscher-ohlin.md│   ├── new-trade-theory-krugman.md│   ├── melitz-firm-heterogeneity.md│   ├── io/│   │   ├── oligopoly-competition.md│   │   ├── entry-deterrence.md│   │   ├── two-sided-markets-platforms.md│   │   └── price-discrimination.md│   └── human_capital_and_labor/│       ├── becker-human-capital.md│       ├── ben-porath-lifecycle.md│       ├── roy-model.md│       ├── cunha-heckman-skill-formation.md│       ├── technology-of-skill-formation.md│       ├── self-productivity-dynamic-complementarity.md│       ├── early-childhood-investment.md│       ├── intergenerational-transmission.md│       ├── education-credit-constraints.md│       ├── occupational-choice-comparative-advantage.md│       ├── task-based-production-acemoglu-restrepo.md│       ├── automation-displacement-reinstatement.md│       ├── human-capital-adaptation-automation-ai.md│       └── directed-technical-change-sbtc.md├── prompts/│   ├── 00-intake.md│   ├── 01-puzzle-refinement.md│   ├── 02-literature-positioning.md│   ├── 03-persona-council.md│   ├── 03b-canonical-model-match.md│   ├── 04-model-primitives.md│   ├── 05-assumption-audit.md│   ├── 06-proposition-generator.md│   ├── 07-proof-sketch.md│   ├── 08-counterexample-finder.md│   ├── 09-economic-interpretation.md│   ├── 10-manuscript-skeleton.md│   ├── gate-01-novelty-risk.md│   ├── gate-02b-canonical-fit.md│   ├── gate-02c-theory-lineage.md│   ├── gate-02-model-coherence.md│   ├── gate-03-non-triviality.md│   ├── gate-04-proof-integrity.md│   └── gate-05-economic-meaning.md├── templates/│   ├── state.json│   ├── academic-econ.latex               # 旧版 PDF 模板（已弃用，现直接写 .tex）│   ├── author_style_guide_econ.md│   └── author_style_guide_default.md└── Exploration/                          # 所有项目工作区（自动生成，不提交内容）    └── Project_NNN_<ModelAbbrev>/

适用与不适用

适用

理论经济学早期构思
经典模型扩展
机制建模
人力资本、劳动经济学、信息经济学、产业组织、行为经济学等理论问题
工作论文初步框架
命题和 proof sketch 的审查
反例与边界情形检查

不适用

真实数据清洗与实证分析
自动完成严格数学证明
自动确认文献 novelty
自动生成可直接投稿的论文
替代研究者做理论判断

已知限制

文献验证需要研究者参与Stage 2 会通过联网搜索核查拟引用文献的真实性，但 researcher 仍需自行判断文献定位是否准确、最新文献是否已被覆盖。LLM 生成的引用可能存在幻觉（作者、标题、期刊看似真实但细节有误），Stage 2 和 PDF 生成前均设有强制验证节点。
Proof sketch 不是正式证明标记为 GAP 或 FALSE_RISK 的部分必须由研究者进一步推导。
模型库不是百科全书model_library/ 是建模模板库，不是完整教材。模型库仅收录具有经济均衡概念和可证命题的结构模型，计量识别框架（如 MTE、Heckman Selection）不在其中。
理论贡献需要研究者判断Gate 可以提示 novelty risk，但不能最终决定论文贡献。

Contributing

欢迎围绕以下方向提交改进：

auction theory、macro、IO、political economy 等专题模型库
更严格的 proof integrity gate
更丰富的 counterexample templates
更多 manuscript PDF 模板样式
explore mode：多轮理论模型空间探索

基本流程：

1. Fork this repository2. Edit prompt files, model_library, or SKILL.md routing logic3. Test on a research hypothesis end-to-end4. Submit a PR describing what changed and why

License

MIT License.

Based on pAI/MSc by Mahmoud Abdelmoneum, Pierfrancesco Beneventano, and Tomaso Poggio.