AI如何协同Stata写出可靠代码?

连享会 · 2026 AI 实证研究专题

1. 基本信息

•时间：2026 年 6 月 27-28 日（周六-周日）

• 授课时段：9:00–12:00；14:30–17:30，答疑 17:30–18:00

• 方式：网络直播 + 45 天回放
• 讲师：司继春（上海对外经贸大学）
• 软件：Python；Stata 17.0+；Agent 工具的安装和配置指南
• 课程主页：
https://www.lianxh.cn/aib.html
• PDF 课程大纲：
https://kc.lianxh.cn/aib.pdf
• 报名链接：
https://www.wjx.top/vm/OrHeZmy.aspx#
• 助教招聘：
https://www.wjx.top/vm/w9JRAkf.aspx#

2. 授课嘉宾

司继春^[4]，上海对外经贸大学统计与信息学院讲师，研究方向包括微观计量经济学、因果推断、财政与国际贸易，成果发表于 Journal of Business & Economic Statistics、《中国人口科学》、《系统工程理论与实践》《财经研究》等期刊。司老师长期关注因果推断、机器学习与实证研究方法的结合，有丰富的数据分析经验。业余时间里，司老师也经常在知乎上耐心作答，用通俗的语言普及统计和计量知识。他的知乎专栏名为「慧航」^[5]，关注者逾 31w，获赞超过 17w。

3. 课程导语

AI 让实证研究变快了，但没有自动让实证研究变好。这是很多人真正开始使用 AI 之后才会意识到的问题。让 AI 写一段代码、整理一张回归表、生成一段机制解释，往往并不难。难的是：你怎么知道这些东西是对的？怎么知道这段机制分析不是事后包装？

实证研究中有几种很常见的误解。

误解一：以为爬到了数据，就有了变量。

现在用 Agent 写爬虫，比过去容易得多。上市公司公告、政府文件、新闻网页、政策文本、社交媒体内容，都可以通过 AI 辅助获取。但数据拿到手，只是第一步。更重要的问题是：这些数据是否完整？字段是否准确？文本分类是否稳定？LLM 标注出来的变量到底测度了什么？如果这些问题没有回答清楚，后面的回归只是把不可靠的变量放进一个看起来规范的模型里。

误解二：以为代码跑通了，结果就可信。

很多人用 AI 写 Python 代码时感觉还不错，但一到 Stata 就开始报错。更麻烦的是，有些代码虽然能跑通，却不一定是对的。AI 可能混入 Python 或 R 的写法，可能使用过时命令，也可能对 reghdfe、csdid、eventdd、ivreghdfe、esttab 这类社区命令理解不完整。实证研究中的代码不是能运行就行，还要能复查、能解释、能对应研究设计。

误解三：以为用了 DID、IV、RD，就有了识别。

方法名称不能替代识别逻辑。一个模型写成 DID，并不自动意味着平行趋势可信；一个变量被称为工具变量，也不自动满足排他性限制；一个政策有实施时间差，也不自动构成干净的准自然实验。AI 可以帮你列出候选方案，但不能替你判断这个研究场景是否真的支持这些假设。识别策略的核心，不是知道方法叫什么，而是说得清楚为什么这个设计能够回答因果问题。

误解四：以为写了一段机制分析，就有了理论贡献。

很多论文的结果部分并不弱，但机制解释往往变得空泛。文章能说明影响了，却说不清楚为什么影响、通过什么路径影响、在哪些条件下影响更强或更弱。AI 可以帮你把文字写得更顺，但如果研究者自己没有机制判断，那段文字很可能只是「看起来像机制」。真正有价值的机制解释，应该能形成清楚的逻辑链条，并进一步转化为可检验命题。

这些问题的共同点是：AI 可以提高执行效率，但不能替代实证判断。

所以，B 班的重点不在于「让 AI 多做一点」，而在于「研究者如何判断 AI 产出是否可靠」。实证研究要经得起复查，至少要过四关：

• 变量关：数据从哪里来，变量是否可追溯、可验证；
• 代码关：Stata 代码是否可运行、可复查，结果是否对应正确的模型设定；
• 识别关：经验关系能否被组织成可信的因果设计；
• 解释关：实证结果能否形成清楚的机制链条和可检验命题。

B 班的四个专题，就围绕这四关依次展开：

B1. 数据与变量：从非结构化信息到可验证变量。这一部分讨论如何用 Agent 获取公告、网页、新闻、政策文本等非结构化信息，更重要的是，如何把这些信息转化为可以进入实证模型的变量。课程关注的不只是「怎么爬」，而是「怎么验证」：如何检查抓取完整性，如何设计文本标注流程，如何评估 LLM 标注结果，如何建立数据字典和变量文档。

B2. Stata × Python × Agent：让 AI 写出可运行、可复查的实证代码。这一部分讨论如何在实证研究中合理分配 Stata、Python 和 Agent 的任务。AI 生成 Python 代码通常更稳定，适合处理数据获取、多源合并、文本处理、批量清洗和自动化任务；而 Stata 仍然是经济学、金融学实证研究中最重要的估计与复现工具之一，许多主流期刊的复现代码仍以 Stata 为主。课程的重点不是让 Stata 和 Python 互相替代，而是让二者各司其职：能用 Python 稳定完成的环节，用 Python 提高效率；必须依赖 Stata 规范和社区命令完成的估计、推断、表格输出和复现环节，则通过本地 Stata Skills 知识库来约束 Agent。你将学习如何让 AI 生成更可靠的 Stata 代码，并从命令、选项、样本、模型和输出结果等环节审查代码是否可运行、可复查、可复现。

B3. 识别策略：从研究设想到因果设计。这一部分讨论如何借助 AI 把一个初步研究想法推进为更清楚的因果设计。无论你现在只是有一个问题，还是已经跑出结果但说不清因果逻辑，都需要回答同一个问题：这个经验关系为什么可以被解释为因果效应？课程将演示如何用 AI 展开候选识别方案、审查核心假设、识别潜在威胁，并设计相应的稳健性检验。

B4. 理论模型构建：从经济直觉到可检验命题。这一部分讨论如何借助 AI 把一个经济直觉推进为简洁的理论模型，并从中推导比较静态和可检验命题。课程不只是教你写一段机制分析，而是训练从模型设定、均衡推导到命题转化为变量设计的完整方法。

一句话概括：「A 班^[6]」更关注如何搭建 AI 科研协作系统，「B 班」则侧重于如何用 AI 把实证研究做扎实。两个班合起来，覆盖的是从 AI 科研工作流到实证论文质量控制的一整套训练。

• 如果你的问题是 AI 不稳定、文献和写作系统没有搭起来，「A 班」更适合你；
• 如果你的问题是数据怎么来、Stata 代码能不能信、识别策略怎么想、机制解释怎么写，「B 班」更适合你。

A 班和 B 班：一套大课程，两条训练线

很多学员会问：A 班（李学恒老师，6 月 20–21 日）和 B 班（司继春老师，6 月 27–28 日）是不是内容重复？简单说，二者是同一套 AI 辅助科研大课程下的两个互补部分：A 班偏向搭建 AI 科研协作系统，B 班偏向把实证研究做扎实。

两门合起来，路径最完整
：A 班帮助你把 AI 融入长期科研流程，包括工作台、文献与知识管理、写作系统和论文修改流程；B 班帮助你把 AI 用在实证研究的关键判断上，包括数据获取、代码复查、识别策略和理论建模。两门连起来，覆盖从 AI 科研工作流到实证论文质量控制的主要环节。
训练目标不同，内容不是简单重复
：A 班更强调搭建可持续使用的 AI 科研协作系统，让 AI 稳定参与文献、数据、写作和修改；B 班更强调形成一套可复查的实证研究质量控制框架，围绕变量、代码、识别和理论解释逐一过关。
如果你希望系统提升，建议 A+B 连起来学
：先用 A 班搭好 AI 科研工作台，再用 B 班把 AI 放进真实实证研究链条中，学习如何判断变量是否可靠、代码是否可复查、识别是否站得住、理论解释是否有支撑。
如果暂时只能选一门，也可以按当前卡点选择
：如果你的主要问题是 AI 工具很多，但没有形成稳定的长期工作系统，可以先学 A 班；如果你的主要问题是数据怎么来、Stata 代码能不能信、识别策略怎么想、理论模型怎么建，可以先学 B 班。
后续补学也能自然衔接
：单独参加任意一门，都能形成相对完整的学习闭环；已经参加 A 班的学员，B 班可以作为实证研究判断能力的深化；先参加 B 班的学员，后续也可以通过 A 班补上长期科研协作系统。

4. 专题介绍

B1. 数据与变量：从非结构化信息到可验证变量

CSMAR、Wind、CNRDS 这类结构化数据库非常重要，但使用门槛相对较低，变量定义也越来越标准化，因此越来越难单独支撑有新意的研究设计。很多真正有价值的信息，往往藏在上市公司公告、政府文件、新闻网页、政策文本、招投标文件、社交媒体内容中——非结构化、分散、难获取，也更难处理。过去，这类数据通常需要较强的编程能力才能系统使用；Agent 的出现，显著降低了研究者进入这类数据源的技术门槛。

但获取到数据，只是第一步。更难的问题在后面：这批数据抓取完整吗？字段定义准确吗？文本分类是否稳定？LLM 标注出来的变量到底测度了什么？如果这些问题没有回答清楚，后面的回归只是把不可靠的变量放进一个看起来规范的模型里。

B1 要解决的，正是「从非结构化信息到可验证变量」这整条链——不只是教你获取数据，更重要的是让你知道数据拿到之后还需要做哪些验证，才算真正过了变量关。

课程围绕两个核心要点展开。

要点一：用 Agent 获取非结构化数据，同时建立对爬取结果的验证能力。 Agent 把数据获取的门槛从「需要熟练的 Python 爬虫能力」降低到「能描述清楚你想要什么」。但门槛降低不等于结果自动可信，研究者仍然需要知道如何判断 Agent 交出来的数据是否真的可用。

• 爬虫任务的正确描述方式：如何告诉 Agent 目标网站是什么、想抓哪些字段、输出什么格式；如何让 Agent 分析页面结构，而不是自己去啃 HTML。
• 从任务描述到可运行脚本：如何处理动态页面、翻页逻辑、附件下载、请求频率控制等常见问题；如何让 Agent 解释代码每一步在做什么，降低黑箱感。
• 如何验证爬取结果：数量核对，即抓到的记录数是否和预期一致；字段核查，即关键字段是否存在系统性缺失或异常值；抽样人工比对，即随机抽取若干条记录和原始网页核对。
• 合规与可持续性：如何优先使用公开信息，控制抓取频率，保存原始链接和抓取时间，避免后期无法复查数据来源。

课堂将以公开公告、政策文本或类似网页资料为例，演示从任务描述、脚本生成、数据导出到结果验证的完整过程。

要点二：用 LLM 将文本转化为变量，并评估变量的可靠性。 LLM 大幅降低了文本变量构造的门槛。情感倾向、政策信号、事件分类、信息含量、风险提示、战略表述等内容，都可以通过批量标注转化为初始变量。但「LLM 给了一个分类结果」和「这个变量可以进入回归」之间，还差一步关键验证。

• 文本标注的工作流：如何组织批量处理；如何设计 prompt 让标注结果稳定、可复现；如何处理边界案例和模糊分类。
• 如何评估 LLM 标注的可靠性：与人工标注进行一致性比较；测试不同 prompt 版本下结果是否稳定；检查标注结果的分布是否符合业务直觉和制度背景。
• 文本变量进入回归的注意事项：LLM 标注引入的测量误差是否可能影响估计；变量定义是否清楚到可以写进论文方法部分；审稿人通常会从哪些角度质疑文本变量的有效性。

课堂将以公司公告、新闻文本或政策文本为例，演示 prompt 设计、批量标注、抽样复核和可靠性验证的完整流程。

课程还会专门讨论数据文档的建立：如何让 Agent 在处理数据的同时自动生成文档初稿，记录数据来源、抓取时间、处理步骤、字段定义、缺失处理、prompt 版本和已知问题。一份好的数据字典，不只是为了存档，而是在审稿人要求说明数据来源、合作者复查变量定义，或者六个月后自己重新打开项目时，能够快速重建对数据的完整理解。

完成 B1，你将拥有：

一套可复用的 Agent 数据获取工作流：从目标网站描述到可运行脚本，配合验证清单，回去对着自己的目标数据源就能上手；
一套 LLM 辅助文本变量构造流程：从原始文本到可进入回归的变量，包含 prompt 模板、批量处理方案和可靠性验证步骤；
一份数据字典模板：覆盖数据来源、抓取完整性、字段定义、缺失处理、prompt 版本和测量说明，让变量定义在论文方法部分经得起追问。

B2. Stata × Python × Agent：让 AI 写出可运行、可复查的实证代码

用 AI 生成实证代码，很多人都有类似经历：运行，报错，把报错发给 AI，它改一版，能跑了；再看结果，系数对不上；继续追问，它又换一种写法。最后代码似乎跑通了，但你不知道这一次和上一次有什么本质区别，也不知道该信哪一个。

这个问题在 Stata 中尤其明显。AI 生成 Python 代码通常相对稳定，因为公开语料中 Python 代码更丰富，也更适合处理数据获取、文本处理、多源合并、批量清洗和自动化任务。但经济学、金融学实证研究不能简单离开 Stata：许多主流期刊的复现代码仍然以 Stata 为主，大量经典工作流、社区命令、表格输出习惯和审稿人预期，也都围绕 Stata 展开。

因此，B2 要解决的不是「Stata 和 Python 谁替代谁」，而是如何让二者各司其职：能用 Python 稳定完成的环节，就用 Python 提高效率；必须依赖 Stata 规范、社区命令和期刊复现习惯的环节，则通过 Agent 和本地 Stata Skills 来提高代码质量和可复查性。

课程围绕三个核心要点展开。

要点一：明确 Stata、Python 与 Agent 的任务分工。在一篇实证论文中，不同工具适合承担不同任务。Python 更适合数据获取、网页解析、文本处理、批量清洗、多源数据合并和自动化调用；Stata 更适合面板模型、固定效应估计、DID、事件研究、IV、稳健性检验、回归表输出和与既有文献复现代码保持一致的分析流程。Agent 的作用，是在研究者设定的规则下生成代码、解释代码、处理报错，并帮助维护脚本结构和数据交接过程。

课程会讲清楚：哪些任务适合交给 Python，哪些任务应该保留在 Stata 中完成，Python 生成的数据如何规范交接给 Stata，变量名、日期、缺失值、编码和中间数据版本应该如何处理，避免同一变量在两个软件中含义发生变化。

要点二：构建本地 Stata Skills 知识库，从源头降低 AI 写 Stata 的错误率。AI 写 Stata 代码频繁出错，重要原因之一是规范的 Stata 学术代码和社区命令语料不足。尤其是经济学实证中常用的 reghdfe、csdid、eventdd、ivreghdfe、esttab 等命令，AI 对其掌握往往不稳定，容易在选项、版本差异和规范写法上出错。

Stata Skills 的核心思路是：与其让 AI 凭记忆猜测命令用法，不如把 help 文档、ado 文件、规范示例和常见报错主动整理成 Agent 可以调用的本地知识库，让它在生成代码之前先「读过说明书」。

课程将介绍如何使用司老师整理好的 Stata Skills 库，覆盖常用社区命令和规范代码模板；也会说明如何扩展和维护自己的 Skills：遇到新命令时，如何快速生成对应的 Skill 文档，如何把自己常用的命令组合、表格格式和图形输出偏好封装进去，从而让 Agent 更稳定地生成符合实证规范的代码。

要点三：建立代码验证习惯，让研究者知道什么时候可以信任 Agent 的输出。有了 Skills 知识库，AI 生成 Stata 代码的质量会提高，但这并不意味着可以盲信。实证研究中的代码不是「能跑」就够了，还要能复查、能解释、能对应研究设计。

课程将建立一套三层验证习惯：

• 命令验证：命令是否真实存在？社区命令是否已经正确安装？选项是否与当前 Stata 版本和命令版本匹配？
• 结果验证：系数方向是否符合经济直觉？数量级是否合理？固定效应、控制变量和聚类标准误是否与研究设计一致？
• 流程验证：样本量是否符合预期？变量定义是否前后一致？Python 与 Stata 之间的数据交接是否清楚？有没有发生意外的样本损失？

这三层验证并不要求学员成为专业程序员，但要求研究者对自己的数据、模型设定和研究设计保持清楚判断。所谓「人在环中」，不是盯着每一行代码，而是在关键节点上知道该检查什么、该追问什么、什么时候不能继续往下跑。

课堂将围绕两个案例展开：一个是「上海车牌拍卖价格」热身案例，用来演示 Python、Stata 与 Agent 的分工，并对比有无 Stata Skills 时 Agent 生成代码的差异；另一个是「财政支出与共同富裕」完整实证案例，展示从基准回归、稳健性检验、异质性分析到期刊规范表格输出的完整流程。

完成 B2，你将拥有：

一套 Stata × Python × Agent 的任务分工原则：知道哪些环节适合用 Python 提高效率，哪些环节应使用 Stata 保持实证规范和复现一致性；
一套可扩展的 Stata Skills 知识库，覆盖 reghdfe、csdid、eventdd、ivreghdfe、esttab 等常用社区命令，并支持根据新命令和个人代码习惯持续扩展；
一套标准 .do 文件结构、回归表输出模板和可视化代码模板，减少在表格格式、图形输出和社区命令选项上的反复 debug；
一份三层代码验证清单（命令验证 → 结果验证 → 流程验证），帮助你围绕命令、样本、模型、结果和输出，对 Agent 生成代码做基本审查。

B3. 识别策略：从研究设想到因果设计

很多实证研究不是卡在不会跑回归，而是卡在如何把一个研究设想组织成可信的因果设计。数据有了，模型也能跑出来，但一旦被问到「为什么这个系数可以解释为因果效应」，问题就会暴露出来：处理组和对照组是否可比？核心假设是什么？最可能的内生性来源在哪里？需要哪些检验来支撑这个设计？

问题的根源往往不是不知道 DID、IV、RD 是什么，而是不知道自己的研究情境是否真的支持这些方法背后的假设。一个模型写成 DID，不自动意味着平行趋势可信；一个变量被称为工具变量，不自动满足排他性限制；一个政策有实施时间差，也不自动构成干净的准自然实验。识别策略的核心，不是知道方法叫什么，而是能说清楚：为什么这个设计能够回答因果问题。

过去，识别能力主要依赖导师指导、seminar 训练和大量阅读高质量论文。AI 提供了一条更低成本、更可反复练习的训练路径。它不能替研究者判断识别是否成立，但可以帮助研究者把识别思维显式化：把一个模糊的研究问题拆解成处理变量、结果变量、对照组、反事实、核心假设和潜在威胁，再逐步讨论哪些方案可行，哪些方案只是看起来可行。

B1 帮你把数据和变量准备好，B2 帮你把代码和结果变得可复查；B3 要解决的，是如何判断这些结果背后的因果逻辑是否站得住。

课程围绕两个核心要点展开。

要点一：用 AI 多轮对话，把识别思维的过程显式化。识别策略不是一步到位的，而是在反复追问中逐渐收敛的。AI 适合充当这个过程中的思考伙伴：它不替你做最终判断，但可以帮你把每一步的逻辑拆开。

• 展开候选方案：如何向 AI 描述研究问题，让它提出可能的识别路径，例如 OLS 加控制变量、面板固定效应、DID、事件研究、IV、RD、合成控制等；如何判断这些方案分别需要什么数据和制度条件。
• 审查核心假设：如何追问每个方案成立所需的关键条件，例如 DID 的平行趋势、IV 的相关性和排他性限制、RD 的断点不可操纵、政策冲击的外生性。
• 识别潜在威胁：如何让 AI 扮演质疑者，列出遗漏变量、反向因果、选择偏误、同期政策冲击、样本选择和测量误差等可能问题。
• 设计稳健性检验：如何把威胁转化为检验，例如平行趋势检验、安慰剂检验、替代变量、样本限制、断点操纵检验、不同聚类方式和异质性分析。稳健性检验不是越多越好，而是要和识别威胁一一对应。

要点二：建立识别案例库，让 AI 的建议有文献依据。AI 在识别问题上的常见局限，是建议听起来合理，但缺少具体文献支撑。解决办法不是让 AI 继续泛泛推荐方法，而是给它一个结构化的识别案例库。

所谓识别案例库，不是完整的文献管理系统，而是专门记录高质量论文中的识别设计。每个案例可以整理为一张卡片：

• 研究问题是什么；
• 关键冲击或处理变量是什么；
• 处理组和对照组如何定义；
• 识别策略是什么；
• 核心假设是什么；
• 最主要的识别威胁在哪里；
• 作者用了哪些稳健性检验说服读者；
• 这篇论文的设计能否迁移到你的研究问题中。

有了这样的案例库，AI 的回答就不只是「我觉得可以用 DID」，而是可以进一步讨论：哪些顶刊论文用过类似设计，它们如何说明核心假设，如何回应可能的质疑，哪些地方可以借鉴，哪些地方不能简单照搬。

识别机会也不只来自论文。政策文本、制度文件、监管公告、试点名单、实施细则中，常常隐藏着可能的准自然实验。课程会演示如何借助 AI 快速扫描这类材料，寻找可能的处理时点、处理对象、制度边界和对照组构造思路。

课堂将以一个具体研究设想为例，现场演示如何用 AI 展开候选识别方案，比较不同方案的数据要求和假设强度，生成识别策略审查表，并把潜在威胁转化为有针对性的稳健性检验设计。

完成 B3，你将拥有：

一套用 AI 多轮对话构建识别策略的方法：从展开候选方案、审查核心假设，到识别潜在威胁、收敛可行设计；
一份识别策略审查表和稳健性检验清单，覆盖「核心假设是什么 → 主要威胁在哪里 → 对应检验如何设计」的完整链条；
一个识别案例库模板，用于沉淀高质量论文中的因果设计，让 AI 在识别讨论中不只是泛泛推荐方法，而是能调用具体案例进行比较和借鉴。

B4. 理论模型构建：从经济直觉到可检验命题

很多实证论文并不是没有结果，而是结果之后缺少一个清楚的经济学解释。基准回归显著，稳健性检验也做了不少，但读者仍然会追问：为什么会有这个影响？这个效应通过什么机制发生？在哪些条件下更强或更弱？这个结果和已有理论是什么关系？能否推出新的可检验命题？

这时，仅仅写一段「机制分析」往往不够。真正有说服力的解释，应该能够把经验现象背后的经济逻辑组织起来：谁在做决策，受到什么约束，激励如何变化，均衡结果为什么会改变。如果能进一步把这些逻辑写成一个简洁的理论模型，并从中推出比较静态和可检验命题，实证结果的理论含量就会明显增强。

AI 降低了理论建模的执行门槛。过去，很多研究者一想到理论模型，就会被符号设定、均衡推导、数值模拟和代码实现挡在门外。现在，Agent 可以帮助研究者整理模型设定、辅助推导均衡条件、完成比较静态、编写模拟代码，甚至把模型命题翻译成实证检验方案。但这并不意味着理论建模可以完全交给 AI。一个模型是否有经济学意义，假设是否合理，命题是否值得检验，仍然需要研究者自己判断。

因此，B4 的重点不是单纯帮实证结果补一段机制解释，而是训练一套 AI 辅助理论建模的方法：从经济直觉出发，建立简洁模型，推导比较静态，再把模型命题转化为可检验的实证设计。

B3 帮你把因果识别的逻辑说清楚；B4 要解决的，是在识别站住之后，如何为实证结果提供真正有结构的理论支撑。

课程围绕三个核心要点展开。

要点一：判断什么是好的经济学模型。 有了 AI 之后，复杂模型更容易被写出来，但复杂不等于有贡献。B4 首先讨论好模型的基本原则：模型不必一开始就很大，而应从最小结构出发；每一个假设都应该有经济学含义，而不是只为数学方便服务；模型的核心产出不是一堆符号，而是清楚的比较静态和可检验预测。

课程将讨论：

• 如何从一个经验现象中提炼核心经济直觉
• 如何确定模型中的主体、选择变量、约束条件和信息结构
• 如何判断哪些假设是必要的，哪些假设只是增加复杂度
• 如何避免 AI 更快地生成一个「复杂但无用」的模型
• 如何从模型中提炼真正能服务论文贡献的命题

这一部分的重点，是帮助学员建立对模型质量的基本判断：一个好模型应该让问题更清楚，而不是让论文看起来更复杂。

要点二：用 Agent 辅助理论推导和数值模拟。 在理论建模中，AI 最适合协助完成的是执行性环节。研究者给出经济直觉和基本设定，Agent 可以帮助把直觉转化为数学表达，检查符号是否一致，推导一阶条件、均衡条件和比较静态，并在需要时编写数值模拟、估计或校准代码。

课程将演示：

• 如何向 Agent 描述一个机制，让它生成模型初稿
• 如何检查 Agent 给出的目标函数、约束条件和均衡定义是否合理
• 如何让 Agent 辅助完成均衡推导和比较静态分析
• 如何用 Python 或 Stata 编写简单的数值模拟、估计或校准代码
• 如何通过极端情形、参数敏感性和数值结果，检查模型结论是否有经济学合理性

Agent 可以帮助推导、模拟和检查符号一致性，但不能替研究者判断模型假设是否有经济学含义、命题是否值得检验、结论是否真正服务论文贡献。

要点三：从理论模型回到实证检验。 理论模型的价值，最终要回到实证研究中。一个模型如果只停留在符号推导里，不能告诉我们应该观察什么变量、做什么检验、如何解释结果，那么它对实证论文的帮助就有限。B4 将重点训练「模型 → 命题 → 变量 → 检验」的转换能力：

• 如何从模型比较静态中提炼可检验命题
• 如何把理论变量翻译成可观测变量或代理变量
• 如何根据命题设计机制检验、异质性分析和补充证据
• 如何用模型帮助解释已有实证结果
• 当实证结果与理论预测不一致时，如何回到模型假设、变量测度和识别设计中重新检查

这部分不是把实证论文改写成纯理论论文，而是让理论模型服务于实证研究：帮助研究者解释为什么会有这个效应，推导还能检验什么，以及哪些机制证据最值得进一步寻找。理论模型不能替代识别策略，但可以帮助澄清机制、提出额外可检验预测，并辅助讨论竞争性解释。

课堂将围绕两个方向展开演示。从理论到实证：以 C-CAPM、引力模型或类似经典模型为例，演示如何借助 Agent 复刻基本模型，理解模型设定、均衡条件和关键命题，再进一步思考如何在已有模型基础上做修正、扩展和实证检验。从实证到理论：给定一组已有实证结果，演示如何让 Agent 系统审视结果、提出可能机制，并在经典模型框架下寻找更有结构的理论解释——以「互联网影响国际贸易的广延边际与集约边际」为例，演示如何区分两类边际的机制逻辑，并进一步回到数据中检验。

完成 B4，你将拥有：

一套判断好模型的标准和检查框架：由小见大、假设有经济含义、比较静态是核心产出、结论可检验，可用于评估自己正在构建或准备构建的模型
一套 Agent 辅助理论建模流程模板：从经济直觉、模型设定、均衡推导、比较静态，到数值模拟、参数校准和敏感性分析
一份「模型 → 命题 → 变量 → 检验」映射模板，帮助你把理论命题转化为机制检验、异质性分析和补充证据
一份理论模型审查清单，用于判断模型假设是否合理、命题是否可检验、模型结论是否真正支撑论文的实证发现

常见问题

FAQs

Q1：没有参加过连享会其他课程，能听懂 B 班吗？可以。B 班的四个专题相对独立，课程会围绕数据、代码、识别和理论建模四个环节展开，对前置课程的依赖度较低。只要具备基本的计量经济学知识，就可以跟上主要内容。

Q2：已经参加过连享会其他相关课程，B 班还有必要参加吗？看你的研究阶段。如果你已经有研究问题、数据来源、初步回归结果或论文框架，B 班仍然有价值。它关注的是实证研究链条中的关键判断：变量是否可靠、代码是否可复查、识别策略是否站得住、机制解释是否有理论含量。这个角度与一般 AI 工具课或写作课不同。

Q3：B 班需要编程基础吗？有 Python 或 Stata 基础的学员，学习起来会更轻松；没有系统编程基础，也可以参加。课程会从实际研究任务出发，讲清楚每一步在做什么、为什么这样做。Agent 负责辅助生成代码，学员需要重点理解研究逻辑、代码含义和结果验证方法。

Q4：课前需要准备哪些软件或工具？建议提前准备 Python、Stata 17.0 及以上版本，并按照课前说明配置相关 Agent 工具。课程会提供安装和配置指南，也会通过助教协助学员完成基础环境准备。

5. 报名与缴费

• 主办方： 太原君泉教育咨询有限公司
• 标准费用 (含报名费、材料费)： 2,400 元/人
• 优惠方案：

• 三人及以上团购 / 专题课老学员：9 折 (2,160 元/人)
• 学生 (需提供学生证/卡照片)：9 折 (2,160 元/人)
• 连享会充值会员：8.5 折 (2,040 元/人)

• 温馨提示： 以上各项优惠不能叠加使用
• 联系方式：

• 邮箱：wjx004@sina.com^[7]
• 王老师：18903405450 (微信同号)
• 李老师：18636102467 (微信同号)

5.1 报名链接

报名链接：
https://www.wjx.top/vm/OrHeZmy.aspx#

或长按/扫描二维码报名：

5.2 缴费方式

缴费方式 1：对公转账

• 户名：太原君泉教育咨询有限公司
• 账号：35117530000023891 ( 晋商银行股份有限公司太原南中环支行)
• 温馨提示： 对公转账时，请务必提供「汇款人姓名-单位」信息，以便确认

缴费方式 2：扫码支付

温馨提示：

• 可以使用已经绑定公务卡的微信/支付宝/云闪付等扫码付款
• 微信转账时，请务必在「添加备注」栏填写「汇款人姓名-单位」信息
• 扫码支付后，请将「付款记录」截屏发给王老师-18903405450 (微信同号)

6. 听课指南

A. 听课设备：

• 支持：手机、iPad 等平板及 Windows/Mac 笔记本
• 不支持：台式机及连接外接显示屏的设备

特别提示：

• 为保护讲师的知识产权和您的账户安全，系统会自动在您观看的视频中嵌入您的「用户名」信息
• 一个账号绑定一台设备，上课后不可切换设备，且听课电脑不得外接显示屏，请提前准备好听课设备
• 本课程为虚拟产品，一经报名，恕不退换
• 课程内容受版权保护，不允许以任何形式录屏或传播

B. 实名制报名

本课程实名制参与，具体要求如下：

• 报名时请提供真实姓名，并附有效证件
• 报名即视为同意「连享会版权保护协议条款^[8]」

7. 助教招聘

• 名额： 20 名
• 任务： 详情参见连享会助教工作指南^[9]

• A. 课前准备：完成 2 篇推文，风格参见连享会主页 www.lianxh.cn^[10]，选题参见这里^[11]
• B. 开课前答疑：协助学员安装软件和使用课件，在微信群中回答一些常见问题
• C. 上课期间答疑：针对上课期间的学习内容，在微信群中答疑 (8:00-9:00, 19:00-22:00)
• Note: 下午 5:30-6:00 的课后答疑由主讲教师负责

• 要求： 热心尽责，熟悉常用 AI 工具，能够解答并记录常见问题
• 特别说明： 往期按时完成任务的助教，可直接联系连老师获得直接录用资格
• 截止时间： 2026 年 6 月 17 日 (将于 6 月 19 日公布遴选结果于连享会主页 lianxh.cn^[12])

申请链接：
https://www.wjx.top/vm/w9JRAkf.aspx#

扫码填写助教申请资料：

课程详情：
https://www.lianxh.cn/details/1782.html

PDF 课程大纲^[1] | 连享会主页^[2] | 报名链接^[3]

引用链接

[1] PDF 课纲: https://kc.lianxh.cn/aib.pdf[2] 课程主页: https://www.lianxh.cn/aib.html[3] 报名链接: https://www.wjx.top/vm/OrHeZmy.aspx#[4] 司继春: https://www.suibe.edu.cn/txxy/2017/0530/c5782a45357/page.htm[5] 「慧航」: https://www.zhihu.com/people/sijichun[6] A 班: https://www.lianxh.cn/details/1777.html[7] wjx004@sina.com: mailto:wjx004@sina.com[8] 连享会版权保护协议条款: https://www.lianxh.cn/news/b16b512ee620b.html[9] 连享会助教工作指南: https://github.com/arlionn/lianxhta/blob/main/_doc_/TA01-QA.md[10] www.lianxh.cn: https://www.lianxh.cn[11] 这里: https://github.com/arlionn/lianxhta[12] lianxh.cn: https://www.lianxh.cn/TA.html