连享会 · 2026 AI 实证研究专题

1. 基本信息
•时间:2026 年 6 月 27-28 日(周六-周日) • 授课时段:9:00–12:00;14:30–17:30,答疑 17:30–18:00 • 方式:网络直播 + 45 天回放 • 讲师:司继春(上海对外经贸大学) • 软件:Python;Stata 17.0+;Agent 工具的安装和配置指南 • 课程主页: https://www.lianxh.cn/aib.html • PDF 课程大纲: https://kc.lianxh.cn/aib.pdf • 报名链接: https://www.wjx.top/vm/OrHeZmy.aspx# • 助教招聘: https://www.wjx.top/vm/w9JRAkf.aspx#
2. 授课嘉宾

司继春[4],上海对外经贸大学统计与信息学院讲师,研究方向包括微观计量经济学、因果推断、财政与国际贸易,成果发表于 Journal of Business & Economic Statistics、《中国人口科学》、《系统工程理论与实践》《财经研究》等期刊。司老师长期关注因果推断、机器学习与实证研究方法的结合,有丰富的数据分析经验。业余时间里,司老师也经常在知乎上耐心作答,用通俗的语言普及统计和计量知识。他的知乎专栏名为「慧航」[5],关注者逾 31w,获赞超过 17w。
3. 课程导语
AI 让实证研究变快了,但没有自动让实证研究变好。这是很多人真正开始使用 AI 之后才会意识到的问题。让 AI 写一段代码、整理一张回归表、生成一段机制解释,往往并不难。难的是:你怎么知道这些东西是对的?怎么知道这段机制分析不是事后包装?
实证研究中有几种很常见的误解。
误解一:以为爬到了数据,就有了变量。
现在用 Agent 写爬虫,比过去容易得多。上市公司公告、政府文件、新闻网页、政策文本、社交媒体内容,都可以通过 AI 辅助获取。但数据拿到手,只是第一步。更重要的问题是:这些数据是否完整?字段是否准确?文本分类是否稳定?LLM 标注出来的变量到底测度了什么?如果这些问题没有回答清楚,后面的回归只是把不可靠的变量放进一个看起来规范的模型里。
误解二:以为代码跑通了,结果就可信。
很多人用 AI 写 Python 代码时感觉还不错,但一到 Stata 就开始报错。更麻烦的是,有些代码虽然能跑通,却不一定是对的。AI 可能混入 Python 或 R 的写法,可能使用过时命令,也可能对 reghdfe、csdid、eventdd、ivreghdfe、esttab 这类社区命令理解不完整。实证研究中的代码不是能运行就行,还要能复查、能解释、能对应研究设计。
误解三:以为用了 DID、IV、RD,就有了识别。
方法名称不能替代识别逻辑。一个模型写成 DID,并不自动意味着平行趋势可信;一个变量被称为工具变量,也不自动满足排他性限制;一个政策有实施时间差,也不自动构成干净的准自然实验。AI 可以帮你列出候选方案,但不能替你判断这个研究场景是否真的支持这些假设。识别策略的核心,不是知道方法叫什么,而是说得清楚为什么这个设计能够回答因果问题。
误解四:以为写了一段机制分析,就有了理论贡献。
很多论文的结果部分并不弱,但机制解释往往变得空泛。文章能说明 影响了 ,却说不清楚为什么影响、通过什么路径影响、在哪些条件下影响更强或更弱。AI 可以帮你把文字写得更顺,但如果研究者自己没有机制判断,那段文字很可能只是「看起来像机制」。真正有价值的机制解释,应该能形成清楚的逻辑链条,并进一步转化为可检验命题。
这些问题的共同点是:AI 可以提高执行效率,但不能替代实证判断。
所以,B 班的重点不在于「让 AI 多做一点」,而在于「研究者如何判断 AI 产出是否可靠」。实证研究要经得起复查,至少要过四关:
• 变量关:数据从哪里来,变量是否可追溯、可验证; • 代码关:Stata 代码是否可运行、可复查,结果是否对应正确的模型设定; • 识别关:经验关系能否被组织成可信的因果设计; • 解释关:实证结果能否形成清楚的机制链条和可检验命题。
B 班的四个专题,就围绕这四关依次展开:
B1. 数据与变量:从非结构化信息到可验证变量。这一部分讨论如何用 Agent 获取公告、网页、新闻、政策文本等非结构化信息,更重要的是,如何把这些信息转化为可以进入实证模型的变量。课程关注的不只是「怎么爬」,而是「怎么验证」:如何检查抓取完整性,如何设计文本标注流程,如何评估 LLM 标注结果,如何建立数据字典和变量文档。
B2. Stata × Python × Agent:让 AI 写出可运行、可复查的实证代码。这一部分讨论如何在实证研究中合理分配 Stata、Python 和 Agent 的任务。AI 生成 Python 代码通常更稳定,适合处理数据获取、多源合并、文本处理、批量清洗和自动化任务;而 Stata 仍然是经济学、金融学实证研究中最重要的估计与复现工具之一,许多主流期刊的复现代码仍以 Stata 为主。课程的重点不是让 Stata 和 Python 互相替代,而是让二者各司其职:能用 Python 稳定完成的环节,用 Python 提高效率;必须依赖 Stata 规范和社区命令完成的估计、推断、表格输出和复现环节,则通过本地 Stata Skills 知识库来约束 Agent。你将学习如何让 AI 生成更可靠的 Stata 代码,并从命令、选项、样本、模型和输出结果等环节审查代码是否可运行、可复查、可复现。
B3. 识别策略:从研究设想到因果设计。这一部分讨论如何借助 AI 把一个初步研究想法推进为更清楚的因果设计。无论你现在只是有一个问题,还是已经跑出结果但说不清因果逻辑,都需要回答同一个问题:这个经验关系为什么可以被解释为因果效应?课程将演示如何用 AI 展开候选识别方案、审查核心假设、识别潜在威胁,并设计相应的稳健性检验。
B4. 理论模型构建:从经济直觉到可检验命题。这一部分讨论如何借助 AI 把一个经济直觉推进为简洁的理论模型,并从中推导比较静态和可检验命题。课程不只是教你写一段机制分析,而是训练从模型设定、均衡推导到命题转化为变量设计的完整方法。
一句话概括:「A 班[6]」更关注如何搭建 AI 科研协作系统,「B 班」则侧重于如何用 AI 把实证研究做扎实。两个班合起来,覆盖的是从 AI 科研工作流到实证论文质量控制的一整套训练。
• 如果你的问题是 AI 不稳定、文献和写作系统没有搭起来,「A 班」更适合你; • 如果你的问题是数据怎么来、Stata 代码能不能信、识别策略怎么想、机制解释怎么写,「B 班」更适合你。
A 班和 B 班:一套大课程,两条训练线
很多学员会问:A 班(李学恒老师,6 月 20–21 日)和 B 班(司继春老师,6 月 27–28 日)是不是内容重复?简单说,二者是同一套 AI 辅助科研大课程下的两个互补部分:A 班偏向搭建 AI 科研协作系统,B 班偏向把实证研究做扎实。
- 两门合起来,路径最完整
:A 班帮助你把 AI 融入长期科研流程,包括工作台、文献与知识管理、写作系统和论文修改流程;B 班帮助你把 AI 用在实证研究的关键判断上,包括数据获取、代码复查、识别策略和理论建模。两门连起来,覆盖从 AI 科研工作流到实证论文质量控制的主要环节。 - 训练目标不同,内容不是简单重复
:A 班更强调搭建可持续使用的 AI 科研协作系统,让 AI 稳定参与文献、数据、写作和修改;B 班更强调形成一套可复查的实证研究质量控制框架,围绕变量、代码、识别和理论解释逐一过关。 - 如果你希望系统提升,建议 A+B 连起来学
:先用 A 班搭好 AI 科研工作台,再用 B 班把 AI 放进真实实证研究链条中,学习如何判断变量是否可靠、代码是否可复查、识别是否站得住、理论解释是否有支撑。 - 如果暂时只能选一门,也可以按当前卡点选择
:如果你的主要问题是 AI 工具很多,但没有形成稳定的长期工作系统,可以先学 A 班;如果你的主要问题是数据怎么来、Stata 代码能不能信、识别策略怎么想、理论模型怎么建,可以先学 B 班。 - 后续补学也能自然衔接
:单独参加任意一门,都能形成相对完整的学习闭环;已经参加 A 班的学员,B 班可以作为实证研究判断能力的深化;先参加 B 班的学员,后续也可以通过 A 班补上长期科研协作系统。
4. 专题介绍
B1. 数据与变量:从非结构化信息到可验证变量
CSMAR、Wind、CNRDS 这类结构化数据库非常重要,但使用门槛相对较低,变量定义也越来越标准化,因此越来越难单独支撑有新意的研究设计。很多真正有价值的信息,往往藏在上市公司公告、政府文件、新闻网页、政策文本、招投标文件、社交媒体内容中——非结构化、分散、难获取,也更难处理。过去,这类数据通常需要较强的编程能力才能系统使用;Agent 的出现,显著降低了研究者进入这类数据源的技术门槛。
但获取到数据,只是第一步。更难的问题在后面:这批数据抓取完整吗?字段定义准确吗?文本分类是否稳定?LLM 标注出来的变量到底测度了什么?如果这些问题没有回答清楚,后面的回归只是把不可靠的变量放进一个看起来规范的模型里。
B1 要解决的,正是「从非结构化信息到可验证变量」这整条链——不只是教你获取数据,更重要的是让你知道数据拿到之后还需要做哪些验证,才算真正过了变量关。
课程围绕两个核心要点展开。
要点一:用 Agent 获取非结构化数据,同时建立对爬取结果的验证能力。 Agent 把数据获取的门槛从「需要熟练的 Python 爬虫能力」降低到「能描述清楚你想要什么」。但门槛降低不等于结果自动可信,研究者仍然需要知道如何判断 Agent 交出来的数据是否真的可用。
• 爬虫任务的正确描述方式:如何告诉 Agent 目标网站是什么、想抓哪些字段、输出什么格式;如何让 Agent 分析页面结构,而不是自己去啃 HTML。 • 从任务描述到可运行脚本:如何处理动态页面、翻页逻辑、附件下载、请求频率控制等常见问题;如何让 Agent 解释代码每一步在做什么,降低黑箱感。 • 如何验证爬取结果:数量核对,即抓到的记录数是否和预期一致;字段核查,即关键字段是否存在系统性缺失或异常值;抽样人工比对,即随机抽取若干条记录和原始网页核对。 • 合规与可持续性:如何优先使用公开信息,控制抓取频率,保存原始链接和抓取时间,避免后期无法复查数据来源。
课堂将以公开公告、政策文本或类似网页资料为例,演示从任务描述、脚本生成、数据导出到结果验证的完整过程。
要点二:用 LLM 将文本转化为变量,并评估变量的可靠性。 LLM 大幅降低了文本变量构造的门槛。情感倾向、政策信号、事件分类、信息含量、风险提示、战略表述等内容,都可以通过批量标注转化为初始变量。但「LLM 给了一个分类结果」和「这个变量可以进入回归」之间,还差一步关键验证。
• 文本标注的工作流:如何组织批量处理;如何设计 prompt 让标注结果稳定、可复现;如何处理边界案例和模糊分类。 • 如何评估 LLM 标注的可靠性:与人工标注进行一致性比较;测试不同 prompt 版本下结果是否稳定;检查标注结果的分布是否符合业务直觉和制度背景。 • 文本变量进入回归的注意事项:LLM 标注引入的测量误差是否可能影响估计;变量定义是否清楚到可以写进论文方法部分;审稿人通常会从哪些角度质疑文本变量的有效性。
课堂将以公司公告、新闻文本或政策文本为例,演示 prompt 设计、批量标注、抽样复核和可靠性验证的完整流程。
课程还会专门讨论数据文档的建立:如何让 Agent 在处理数据的同时自动生成文档初稿,记录数据来源、抓取时间、处理步骤、字段定义、缺失处理、prompt 版本和已知问题。一份好的数据字典,不只是为了存档,而是在审稿人要求说明数据来源、合作者复查变量定义,或者六个月后自己重新打开项目时,能够快速重建对数据的完整理解。
完成 B1,你将拥有:
一套可复用的 Agent 数据获取工作流:从目标网站描述到可运行脚本,配合验证清单,回去对着自己的目标数据源就能上手; 一套 LLM 辅助文本变量构造流程:从原始文本到可进入回归的变量,包含 prompt 模板、批量处理方案和可靠性验证步骤; 一份数据字典模板:覆盖数据来源、抓取完整性、字段定义、缺失处理、prompt 版本和测量说明,让变量定义在论文方法部分经得起追问。
B2. Stata × Python × Agent:让 AI 写出可运行、可复查的实证代码
用 AI 生成实证代码,很多人都有类似经历:运行,报错,把报错发给 AI,它改一版,能跑了;再看结果,系数对不上;继续追问,它又换一种写法。最后代码似乎跑通了,但你不知道这一次和上一次有什么本质区别,也不知道该信哪一个。
这个问题在 Stata 中尤其明显。AI 生成 Python 代码通常相对稳定,因为公开语料中 Python 代码更丰富,也更适合处理数据获取、文本处理、多源合并、批量清洗和自动化任务。但经济学、金融学实证研究不能简单离开 Stata:许多主流期刊的复现代码仍然以 Stata 为主,大量经典工作流、社区命令、表格输出习惯和审稿人预期,也都围绕 Stata 展开。
因此,B2 要解决的不是「Stata 和 Python 谁替代谁」,而是如何让二者各司其职:能用 Python 稳定完成的环节,就用 Python 提高效率;必须依赖 Stata 规范、社区命令和期刊复现习惯的环节,则通过 Agent 和本地 Stata Skills 来提高代码质量和可复查性。
课程围绕三个核心要点展开。
要点一:明确 Stata、Python 与 Agent 的任务分工。在一篇实证论文中,不同工具适合承担不同任务。Python 更适合数据获取、网页解析、文本处理、批量清洗、多源数据合并和自动化调用;Stata 更适合面板模型、固定效应估计、DID、事件研究、IV、稳健性检验、回归表输出和与既有文献复现代码保持一致的分析流程。Agent 的作用,是在研究者设定的规则下生成代码、解释代码、处理报错,并帮助维护脚本结构和数据交接过程。
课程会讲清楚:哪些任务适合交给 Python,哪些任务应该保留在 Stata 中完成,Python 生成的数据如何规范交接给 Stata,变量名、日期、缺失值、编码和中间数据版本应该如何处理,避免同一变量在两个软件中含义发生变化。
要点二:构建本地 Stata Skills 知识库,从源头降低 AI 写 Stata 的错误率。AI 写 Stata 代码频繁出错,重要原因之一是规范的 Stata 学术代码和社区命令语料不足。尤其是经济学实证中常用的 reghdfe、csdid、eventdd、ivreghdfe、esttab 等命令,AI 对其掌握往往不稳定,容易在选项、版本差异和规范写法上出错。
Stata Skills 的核心思路是:与其让 AI 凭记忆猜测命令用法,不如把 help 文档、ado 文件、规范示例和常见报错主动整理成 Agent 可以调用的本地知识库,让它在生成代码之前先「读过说明书」。
课程将介绍如何使用司老师整理好的 Stata Skills 库,覆盖常用社区命令和规范代码模板;也会说明如何扩展和维护自己的 Skills:遇到新命令时,如何快速生成对应的 Skill 文档,如何把自己常用的命令组合、表格格式和图形输出偏好封装进去,从而让 Agent 更稳定地生成符合实证规范的代码。
要点三:建立代码验证习惯,让研究者知道什么时候可以信任 Agent 的输出。有了 Skills 知识库,AI 生成 Stata 代码的质量会提高,但这并不意味着可以盲信。实证研究中的代码不是「能跑」就够了,还要能复查、能解释、能对应研究设计。
课程将建立一套三层验证习惯:
• 命令验证:命令是否真实存在?社区命令是否已经正确安装?选项是否与当前 Stata 版本和命令版本匹配? • 结果验证:系数方向是否符合经济直觉?数量级是否合理?固定效应、控制变量和聚类标准误是否与研究设计一致? • 流程验证:样本量是否符合预期?变量定义是否前后一致?Python 与 Stata 之间的数据交接是否清楚?有没有发生意外的样本损失?
这三层验证并不要求学员成为专业程序员,但要求研究者对自己的数据、模型设定和研究设计保持清楚判断。所谓「人在环中」,不是盯着每一行代码,而是在关键节点上知道该检查什么、该追问什么、什么时候不能继续往下跑。
课堂将围绕两个案例展开:一个是「上海车牌拍卖价格」热身案例,用来演示 Python、Stata 与 Agent 的分工,并对比有无 Stata Skills 时 Agent 生成代码的差异;另一个是「财政支出与共同富裕」完整实证案例,展示从基准回归、稳健性检验、异质性分析到期刊规范表格输出的完整流程。
完成 B2,你将拥有:
一套 Stata × Python × Agent 的任务分工原则:知道哪些环节适合用 Python 提高效率,哪些环节应使用 Stata 保持实证规范和复现一致性; 一套可扩展的 Stata Skills 知识库,覆盖 reghdfe、csdid、eventdd、ivreghdfe、esttab等常用社区命令,并支持根据新命令和个人代码习惯持续扩展;一套标准 .do文件结构、回归表输出模板和可视化代码模板,减少在表格格式、图形输出和社区命令选项上的反复 debug;一份三层代码验证清单(命令验证 → 结果验证 → 流程验证),帮助你围绕命令、样本、模型、结果和输出,对 Agent 生成代码做基本审查。
B3. 识别策略:从研究设想到因果设计
很多实证研究不是卡在不会跑回归,而是卡在如何把一个研究设想组织成可信的因果设计。数据有了,模型也能跑出来,但一旦被问到「为什么这个系数可以解释为因果效应」,问题就会暴露出来:处理组和对照组是否可比?核心假设是什么?最可能的内生性来源在哪里?需要哪些检验来支撑这个设计?
问题的根源往往不是不知道 DID、IV、RD 是什么,而是不知道自己的研究情境是否真的支持这些方法背后的假设。一个模型写成 DID,不自动意味着平行趋势可信;一个变量被称为工具变量,不自动满足排他性限制;一个政策有实施时间差,也不自动构成干净的准自然实验。识别策略的核心,不是知道方法叫什么,而是能说清楚:为什么这个设计能够回答因果问题。
过去,识别能力主要依赖导师指导、seminar 训练和大量阅读高质量论文。AI 提供了一条更低成本、更可反复练习的训练路径。它不能替研究者判断识别是否成立,但可以帮助研究者把识别思维显式化:把一个模糊的研究问题拆解成处理变量、结果变量、对照组、反事实、核心假设和潜在威胁,再逐步讨论哪些方案可行,哪些方案只是看起来可行。
B1 帮你把数据和变量准备好,B2 帮你把代码和结果变得可复查;B3 要解决的,是如何判断这些结果背后的因果逻辑是否站得住。
课程围绕两个核心要点展开。
要点一:用 AI 多轮对话,把识别思维的过程显式化。识别策略不是一步到位的,而是在反复追问中逐渐收敛的。AI 适合充当这个过程中的思考伙伴:它不替你做最终判断,但可以帮你把每一步的逻辑拆开。
• 展开候选方案:如何向 AI 描述研究问题,让它提出可能的识别路径,例如 OLS 加控制变量、面板固定效应、DID、事件研究、IV、RD、合成控制等;如何判断这些方案分别需要什么数据和制度条件。 • 审查核心假设:如何追问每个方案成立所需的关键条件,例如 DID 的平行趋势、IV 的相关性和排他性限制、RD 的断点不可操纵、政策冲击的外生性。 • 识别潜在威胁:如何让 AI 扮演质疑者,列出遗漏变量、反向因果、选择偏误、同期政策冲击、样本选择和测量误差等可能问题。 • 设计稳健性检验:如何把威胁转化为检验,例如平行趋势检验、安慰剂检验、替代变量、样本限制、断点操纵检验、不同聚类方式和异质性分析。稳健性检验不是越多越好,而是要和识别威胁一一对应。
要点二:建立识别案例库,让 AI 的建议有文献依据。AI 在识别问题上的常见局限,是建议听起来合理,但缺少具体文献支撑。解决办法不是让 AI 继续泛泛推荐方法,而是给它一个结构化的识别案例库。
所谓识别案例库,不是完整的文献管理系统,而是专门记录高质量论文中的识别设计。每个案例可以整理为一张卡片:
• 研究问题是什么; • 关键冲击或处理变量是什么; • 处理组和对照组如何定义; • 识别策略是什么; • 核心假设是什么; • 最主要的识别威胁在哪里; • 作者用了哪些稳健性检验说服读者; • 这篇论文的设计能否迁移到你的研究问题中。
有了这样的案例库,AI 的回答就不只是「我觉得可以用 DID」,而是可以进一步讨论:哪些顶刊论文用过类似设计,它们如何说明核心假设,如何回应可能的质疑,哪些地方可以借鉴,哪些地方不能简单照搬。
识别机会也不只来自论文。政策文本、制度文件、监管公告、试点名单、实施细则中,常常隐藏着可能的准自然实验。课程会演示如何借助 AI 快速扫描这类材料,寻找可能的处理时点、处理对象、制度边界和对照组构造思路。
课堂将以一个具体研究设想为例,现场演示如何用 AI 展开候选识别方案,比较不同方案的数据要求和假设强度,生成识别策略审查表,并把潜在威胁转化为有针对性的稳健性检验设计。
完成 B3,你将拥有:
一套用 AI 多轮对话构建识别策略的方法:从展开候选方案、审查核心假设,到识别潜在威胁、收敛可行设计; 一份识别策略审查表和稳健性检验清单,覆盖「核心假设是什么 → 主要威胁在哪里 → 对应检验如何设计」的完整链条; 一个识别案例库模板,用于沉淀高质量论文中的因果设计,让 AI 在识别讨论中不只是泛泛推荐方法,而是能调用具体案例进行比较和借鉴。
B4. 理论模型构建:从经济直觉到可检验命题
很多实证论文并不是没有结果,而是结果之后缺少一个清楚的经济学解释。基准回归显著,稳健性检验也做了不少,但读者仍然会追问:为什么会有这个影响?这个效应通过什么机制发生?在哪些条件下更强或更弱?这个结果和已有理论是什么关系?能否推出新的可检验命题?
这时,仅仅写一段「机制分析」往往不够。真正有说服力的解释,应该能够把经验现象背后的经济逻辑组织起来:谁在做决策,受到什么约束,激励如何变化,均衡结果为什么会改变。如果能进一步把这些逻辑写成一个简洁的理论模型,并从中推出比较静态和可检验命题,实证结果的理论含量就会明显增强。
AI 降低了理论建模的执行门槛。过去,很多研究者一想到理论模型,就会被符号设定、均衡推导、数值模拟和代码实现挡在门外。现在,Agent 可以帮助研究者整理模型设定、辅助推导均衡条件、完成比较静态、编写模拟代码,甚至把模型命题翻译成实证检验方案。但这并不意味着理论建模可以完全交给 AI。一个模型是否有经济学意义,假设是否合理,命题是否值得检验,仍然需要研究者自己判断。
因此,B4 的重点不是单纯帮实证结果补一段机制解释,而是训练一套 AI 辅助理论建模的方法:从经济直觉出发,建立简洁模型,推导比较静态,再把模型命题转化为可检验的实证设计。
B3 帮你把因果识别的逻辑说清楚;B4 要解决的,是在识别站住之后,如何为实证结果提供真正有结构的理论支撑。
课程围绕三个核心要点展开。
要点一:判断什么是好的经济学模型。 有了 AI 之后,复杂模型更容易被写出来,但复杂不等于有贡献。B4 首先讨论好模型的基本原则:模型不必一开始就很大,而应从最小结构出发;每一个假设都应该有经济学含义,而不是只为数学方便服务;模型的核心产出不是一堆符号,而是清楚的比较静态和可检验预测。
课程将讨论:
• 如何从一个经验现象中提炼核心经济直觉 • 如何确定模型中的主体、选择变量、约束条件和信息结构 • 如何判断哪些假设是必要的,哪些假设只是增加复杂度 • 如何避免 AI 更快地生成一个「复杂但无用」的模型 • 如何从模型中提炼真正能服务论文贡献的命题
这一部分的重点,是帮助学员建立对模型质量的基本判断:一个好模型应该让问题更清楚,而不是让论文看起来更复杂。
要点二:用 Agent 辅助理论推导和数值模拟。 在理论建模中,AI 最适合协助完成的是执行性环节。研究者给出经济直觉和基本设定,Agent 可以帮助把直觉转化为数学表达,检查符号是否一致,推导一阶条件、均衡条件和比较静态,并在需要时编写数值模拟、估计或校准代码。
课程将演示:
• 如何向 Agent 描述一个机制,让它生成模型初稿 • 如何检查 Agent 给出的目标函数、约束条件和均衡定义是否合理 • 如何让 Agent 辅助完成均衡推导和比较静态分析 • 如何用 Python 或 Stata 编写简单的数值模拟、估计或校准代码 • 如何通过极端情形、参数敏感性和数值结果,检查模型结论是否有经济学合理性
Agent 可以帮助推导、模拟和检查符号一致性,但不能替研究者判断模型假设是否有经济学含义、命题是否值得检验、结论是否真正服务论文贡献。
要点三:从理论模型回到实证检验。 理论模型的价值,最终要回到实证研究中。一个模型如果只停留在符号推导里,不能告诉我们应该观察什么变量、做什么检验、如何解释结果,那么它对实证论文的帮助就有限。B4 将重点训练「模型 → 命题 → 变量 → 检验」的转换能力:
• 如何从模型比较静态中提炼可检验命题 • 如何把理论变量翻译成可观测变量或代理变量 • 如何根据命题设计机制检验、异质性分析和补充证据 • 如何用模型帮助解释已有实证结果 • 当实证结果与理论预测不一致时,如何回到模型假设、变量测度和识别设计中重新检查
这部分不是把实证论文改写成纯理论论文,而是让理论模型服务于实证研究:帮助研究者解释为什么会有这个效应,推导还能检验什么,以及哪些机制证据最值得进一步寻找。理论模型不能替代识别策略,但可以帮助澄清机制、提出额外可检验预测,并辅助讨论竞争性解释。
课堂将围绕两个方向展开演示。从理论到实证:以 C-CAPM、引力模型或类似经典模型为例,演示如何借助 Agent 复刻基本模型,理解模型设定、均衡条件和关键命题,再进一步思考如何在已有模型基础上做修正、扩展和实证检验。从实证到理论:给定一组已有实证结果,演示如何让 Agent 系统审视结果、提出可能机制,并在经典模型框架下寻找更有结构的理论解释——以「互联网影响国际贸易的广延边际与集约边际」为例,演示如何区分两类边际的机制逻辑,并进一步回到数据中检验。
完成 B4,你将拥有:
一套判断好模型的标准和检查框架:由小见大、假设有经济含义、比较静态是核心产出、结论可检验,可用于评估自己正在构建或准备构建的模型 一套 Agent 辅助理论建模流程模板:从经济直觉、模型设定、均衡推导、比较静态,到数值模拟、参数校准和敏感性分析 一份「模型 → 命题 → 变量 → 检验」映射模板,帮助你把理论命题转化为机制检验、异质性分析和补充证据 一份理论模型审查清单,用于判断模型假设是否合理、命题是否可检验、模型结论是否真正支撑论文的实证发现
常见问题
FAQs
Q1:没有参加过连享会其他课程,能听懂 B 班吗?可以。B 班的四个专题相对独立,课程会围绕数据、代码、识别和理论建模四个环节展开,对前置课程的依赖度较低。只要具备基本的计量经济学知识,就可以跟上主要内容。
Q2:已经参加过连享会其他相关课程,B 班还有必要参加吗?看你的研究阶段。如果你已经有研究问题、数据来源、初步回归结果或论文框架,B 班仍然有价值。它关注的是实证研究链条中的关键判断:变量是否可靠、代码是否可复查、识别策略是否站得住、机制解释是否有理论含量。这个角度与一般 AI 工具课或写作课不同。
Q3:B 班需要编程基础吗?有 Python 或 Stata 基础的学员,学习起来会更轻松;没有系统编程基础,也可以参加。课程会从实际研究任务出发,讲清楚每一步在做什么、为什么这样做。Agent 负责辅助生成代码,学员需要重点理解研究逻辑、代码含义和结果验证方法。
Q4:课前需要准备哪些软件或工具?建议提前准备 Python、Stata 17.0 及以上版本,并按照课前说明配置相关 Agent 工具。课程会提供安装和配置指南,也会通过助教协助学员完成基础环境准备。
5. 报名与缴费
• 主办方: 太原君泉教育咨询有限公司 • 标准费用 (含报名费、材料费): 2,400 元/人 • 优惠方案: • 三人及以上团购 / 专题课老学员:9 折 (2,160 元/人) • 学生 (需提供学生证/卡照片):9 折 (2,160 元/人) • 连享会充值会员:8.5 折 (2,040 元/人) • 温馨提示: 以上各项优惠不能叠加使用 • 联系方式: • 邮箱:wjx004@sina.com[7] • 王老师:18903405450 (微信同号) • 李老师:18636102467 (微信同号)
5.1 报名链接
报名链接:
https://www.wjx.top/vm/OrHeZmy.aspx#
或长按/扫描二维码报名:

5.2 缴费方式
缴费方式 1:对公转账
• 户名:太原君泉教育咨询有限公司 • 账号:35117530000023891 ( 晋商银行股份有限公司太原南中环支行) • 温馨提示: 对公转账时,请务必提供「汇款人姓名-单位」信息,以便确认
缴费方式 2:扫码支付

温馨提示:
• 可以使用已经绑定公务卡的微信/支付宝/云闪付等扫码付款 • 微信转账时,请务必在「添加备注」栏填写「汇款人姓名-单位」信息 • 扫码支付后,请将「付款记录」截屏发给王老师-18903405450 (微信同号)
6. 听课指南
A. 听课设备:
• 支持:手机、iPad 等平板及 Windows/Mac 笔记本 • 不支持:台式机及连接外接显示屏的设备
特别提示:
• 为保护讲师的知识产权和您的账户安全,系统会自动在您观看的视频中嵌入您的「用户名」信息 • 一个账号绑定一台设备,上课后不可切换设备,且听课电脑不得外接显示屏,请提前准备好听课设备 • 本课程为虚拟产品,一经报名,恕不退换 • 课程内容受版权保护,不允许以任何形式录屏或传播
B. 实名制报名
本课程实名制参与,具体要求如下:
• 报名时请提供真实姓名,并附有效证件 • 报名即视为同意「连享会版权保护协议条款[8]」
7. 助教招聘
• 名额: 20 名 • 任务: 详情参见 连享会助教工作指南[9] • A. 课前准备:完成 2 篇推文,风格参见连享会主页 www.lianxh.cn[10],选题参见 这里[11] • B. 开课前答疑:协助学员安装软件和使用课件,在微信群中回答一些常见问题 • C. 上课期间答疑:针对上课期间的学习内容,在微信群中答疑 (8:00-9:00, 19:00-22:00) • Note: 下午 5:30-6:00 的课后答疑由主讲教师负责 • 要求: 热心尽责,熟悉常用 AI 工具,能够解答并记录常见问题 • 特别说明: 往期按时完成任务的助教,可直接联系连老师获得直接录用资格 • 截止时间: 2026 年 6 月 17 日 (将于 6 月 19 日公布遴选结果于连享会主页 lianxh.cn[12])
申请链接:
https://www.wjx.top/vm/w9JRAkf.aspx#
扫码填写助教申请资料:

课程详情:
https://www.lianxh.cn/details/1782.html
PDF 课程大纲[1] | 连享会主页[2] | 报名链接[3]
引用链接
[1] PDF 课纲: https://kc.lianxh.cn/aib.pdf[2] 课程主页: https://www.lianxh.cn/aib.html[3] 报名链接: https://www.wjx.top/vm/OrHeZmy.aspx#[4] 司继春: https://www.suibe.edu.cn/txxy/2017/0530/c5782a45357/page.htm[5] 「慧航」: https://www.zhihu.com/people/sijichun[6] A 班: https://www.lianxh.cn/details/1777.html[7] wjx004@sina.com: mailto:wjx004@sina.com[8] 连享会版权保护协议条款: https://www.lianxh.cn/news/b16b512ee620b.html[9] 连享会助教工作指南: https://github.com/arlionn/lianxhta/blob/main/_doc_/TA01-QA.md[10] www.lianxh.cn: https://www.lianxh.cn[11] 这里: https://github.com/arlionn/lianxhta[12] lianxh.cn: https://www.lianxh.cn/TA.html
夜雨聆风