以OpenClaw、Claude、Codex等大模型智能体为代表的人工智能(Artificial Intelligence)工具的涌现,不断重塑实证研究与计算社会科学研究范式,智能体与Python、Stata的深度融合正在将实证研究的效率、精度与自动化水平推升至前所未有的高度。
我们整合实证研究100+实战Skill库,系统讲授如何利用Claude Code等AI智能体工具,将经管实证研究从“手搓代码”的传统模式升级为“指挥智能体”协同工作的全自动化流程。让您的AI智能体团队(选题Agent、数据Agent、建模Agent、写作Agent)协同工作,自动完成从选题、文献综述、数据清洗、因果估计、论文撰写到审稿全流程。
课程覆盖从环境配置、经典因果推断(DID、IV、RDD、PSM)到前沿方法(交叠DID稳健估计、Bunching-DID、双重机器学习DDML、因果森林)的完整方法链条,并通过LLM增强的PSM/SCM与多智能体辩论机制,解决小样本与反事实推理难题。 在变量测度层面,课程依托大语言模型赋能网络数据采集、年报与MD&A文本分析、乃至图片信息提取,实现多模态数据的自动化实证变量构建。最终,课程以AER/QJE级别论文的完整复现、多智能体审稿团队配置以及个人HLER科研系统搭建为收官,帮助学员在三天内完成从方法掌握到系统落地的实质性跨越。

1. 课程概览
以OpenClaw、Claude、Codex等大模型智能体为代表的人工智能(Artificial Intelligence)工具的涌现,不断重塑实证研究与计算社会科学研究范式,智能体与Python、Stata的深度融合正在将实证研究的效率、精度与自动化水平推升至前所未有的高度。
我们整合实证研究100+实战Skill库,系统讲授如何利用Claude Code等AI智能体工具,将经管实证研究从“手搓代码”的传统模式升级为“指挥智能体”协同工作的全自动化流程。让您的AI智能体团队(选题Agent、数据Agent、建模Agent、写作Agent)协同工作,自动完成从选题、文献综述、数据清洗、因果估计、论文撰写到审稿全流程。
课程覆盖从环境配置、经典因果推断(DID、IV、RDD、PSM)到前沿方法(交叠DID稳健估计、Bunching-DID、双重机器学习DDML、因果森林)的完整方法链条,并通过LLM增强的PSM/SCM与多智能体辩论机制,解决小样本与反事实推理难题。 在变量测度层面,课程依托大语言模型赋能网络数据采集、年报与MD&A文本分析、乃至图片信息提取,实现多模态数据的自动化实证变量构建。最终,课程以AER/QJE级别论文的完整复现、多智能体审稿团队配置以及个人HLER科研系统搭建为收官,帮助学员在三天内完成从方法掌握到系统落地的实质性跨越。

课程名称:AI Agent智能因果推断与实证研究特训营
课程时间:2026年7月24日-26日 上午10:00-12:00下午14:00-16:00
授课形式:腾讯会议线上直播+课后回放+课程资料+答疑
报名方式:

本课程优势:
✅100+Skill全自动化:覆盖“选题→综述→数据→因果推断(DID/IV/RDD/SCM/DDML)→写作→复现→审稿”的每一个环节
✅ 前沿数据方法: 囊括交叠DID稳健估计、群聚双重差分、双重机器学习(DDML)、因果森林及LLM增强的PSM/SCM,文本、图片、pdf多模态数据指标测度
✅ 5+顶刊复现系统: 复现Management Science、Strategic Management Journal、《会计研究》核心方法,手把手教你用Claude Code复现AER/QJE论文全文,生成专业的复现报告
✅ 赠价值998的Python&Stata基础课: 涵盖基础语法、数据清洗、面板构建到实证分析、顶刊复现
Austin 老师:经济学博士,211高校商学院副教授,主要从事科研智能体搭建与应用,评价理论与方法、应用计量分析、能源环境经济学等方向,国家自然科学基金项目主持人。在Operations Research等UTD24顶级期刊, ABS4星顶级期刊发表论文多篇。Nature 等国际知名期刊匿名审稿人;国际SCI期刊客座编辑;自科基金评审专家
3. 课程大纲
专题一:多模态数据实证变量构建研究范式
1.多模态数据定义与实证研究价值:文本、音频、视频、图片四类非结构化数据,具备非结构化数据的信息密度、多模态互补性等优势
2. FT50顶刊中多模态数据常见应用范式:系统性梳理顶刊经典应用文献,多模态数据+LLM结构化处理+因果识别
3.核心关键任务之结构化信息提取:从多模态内容中自动抽取关键实体、时间、地点、数值、政策条款、行为事件、情等,转化为可直接回归的实证变量,解决非结构化数据难量化问题
专题一:Claude Code智能体环境搭建与编程协同
课时1:AI科研新范式与智能体核心
1.课程全景介绍:从“手搓科研”、“写代码”到“指挥智能体”的范式革命
2.AI Agent核心概念:LLM原理(Transformer/自注意力)、Agent vs 对话式AI、CoT思维链
3.主流智能体深度解析:对比Claude Code、VS Code 、 Codex、Work Buddy主流智能体框架,工作原理、操作演示、Project、MCP (Model Context Protocol) 等
4.人机协作高阶思维模型:
(1)自指内核:验证Agent输出的“自信度+逻辑审查”双通道法
(2)元认知架构:让AI的思考过程透明化、可迭代,在提示中嵌入元认知指令
(3)人类保留判断权(Human-in-the-Loop):HLER系统的设计哲学
课时2:环境配置与“Harness四件套”协同实战
1.科研环境协同配置:VS Code + Claude Code + Anaconda (Python) + Stata MP 的实证研究协同配置方案
2.自然语言生成代码的RTCE框架(角色/任务/约束/示例)
3.实操1:配置Stata MCP:让Claude Code能直接调用并执行Stata命令,给出分析结果报告
4.实操2:Harness四件套实战:Memory (项目背景记忆)、Skills (调用“计量分析”可复用Skill)、MCP (连接本地数据文件夹、连接Zotero等外部数据库)、Hooks (自动核查样本量并预警)
5.实操3:让Claude自动调用Python和Stata做固定效应模型生成回归结果表,并比较结果
课时3:智能体Skill构建实操
1.Skill开发、改良与封装:Skill定义与科研价值、Skill标准结构(元数据、输入/输出、处理逻辑、测试用例)、开发流程、社区资源获取(ClawHub、SkillHub)、现成Skill个性化改良方法(提示词修改、后处理逻辑增加)、Skill封装
2.实操4:拆解学术全流程Skill与实战:Academic-Research-Skills把学术研究完整流程拆成可独立调用、可串联协作的阶段式工作流
3.课后Skill包:提供10个基础数据处理与模型设定Skill。
专题二:AI Agent经典因果推断方法自动化
课时1:因果推断实证范式与因果图
1.因果推断实证范式:潜在结果框架(Rubin Causal Model)、反事实定义、分配机制(随机/非随机)
2.因果图(DAG)与因果路径识别:综合运用因果知识嵌入微调语言模型、因果提示词(思维链CoT),让Agent根据文献变量关系自动绘制DAG,推导变量间可能的因果关系
3.AI辅助工具变量选择:依托大模型的文献检索与领域知识,通过叙述推理、角色扮演与反事实推理,系统搜索适配不同经管场景的IV(如历史移民分布、地质特征、政策冲击)
课时2:经典因果推断方法介绍及Skill应用
1.面板数据模型及Skill:固定效应(FE)、随机效应(RE)、Hausman检验;高维固定效应(`reghdfe`)
2.双重差分(DID)及Skill:标准DID、平行趋势检验、安慰剂检验;交错DID的偏误与Goodman-Bacon分解;Callaway-Sant‘Anna异质性处理效应估计量
3.工具变量(IV)及Skill:2SLS、弱工具检验(F统计量)、过度识别检验(Sargan/Hansen)。
4.断点回归(RDD)及Skill:精确/模糊断点、带宽选择(MSE最优)、操纵检验(McCrary密度检验)
5.倾向得分匹配(PSM)及Skill:近邻匹配、核匹配、半径匹配;平衡性检验(标准化偏差)
6.实操5:“DID助手”构建Agent实操:输入Card & Krueger (1994) 数据,Agent自动运行DID、绘制平行趋势图、输出ATE,并进行安慰剂检验
专题三:AI Agent前沿DID方法自动化
课时1:交叠DID的陷阱与稳健估计量
1.交错DID与传统TWFE的识别偏误:交错处理的定义与典型场景;TWFE在异质性效应下的负权重问题与异质性处理效应偏误
2.传统DID偏误的诊断工具Bacon分解:Bacon分解的基本思想;子样本比较类型与权重结构
3.Callaway & Sant’Anna(CS)估计量:CS的识别逻辑;队列划分与动态处理效应;总体平均处理效应的构建
4.Sun & Abraham(SA)方法:适用场景与识别前提;与CS方法的核心区别
5.实操1:三大稳健估计量一键实现。让Agent根据数据自动选择并运行:csdid (Callaway-Sant‘Anna)、did_imputation (插补法)、eventstudyinteract (交互加权法),并对比三者的组别-时期ATT结果,生成对比图表。
6.文献精读:Agent辅助分析一篇AER交叠DID论文,复现其主要图表。
课时2:群聚-双重差分(Bunching-DID)
1.群聚现象:非线性政策激励(如税率跳点、补贴门槛)引发行为聚束
2.群聚结构估计难题:聚束分析(Bunching)的的视角盲区,双重差分法(DID)的致命干扰
3.Bunching-DID的基本原理与估计方法
4.Bunching-DID的标准化实施流程
门槛处反事实分布拟合(高阶多项式回归)
操纵区间(Manipulation Window)的客观划定
操纵区间内的ITT效应评估
非操纵区间内的DID无偏估计(核心回归)
安慰剂检验与带宽稳健性
参考文献:
[1]蔡宏波,汤城建,毛健.减税激励与企业异质性创新[J].经济研究,2025,60(02):107-123.
[2]孟元,杨蓉.大数据时代的政府治理:数字政府与企业研发操纵[J].世界经济, 2024, 47(1): 118-149
5.实操2:基于Agent的群聚DID识别估计
专题四:机器学习因果推断与LLM增强
课时1:双重机器学习(DDML)与因果森林
1.理论:双重机器学习DML基本框架及优势(高维数据下的变量选择与估计;非线性关系建模;缓解机器学习估计中存在的“正则偏误”)。DDML的Neyman正交化与交叉拟合原理
2.异质性处理效应(CATE)与因果森林
3.实操1:DDML案例复现。复刻《数量经济技术经济研究》论文“网络基础设施、包容性绿色增长与地区差距”,Agent自动运行DDML模型,输出ATE
4.实操2:因果森林异质性处理效应 (CATE) 分析。使用EconML的CausalForestDML,Agent自动寻找高响应群体,并绘制分群效应图
课时2:LLM增强反事实推理与多智能体辩论
1.LLM增强倾向得分匹配:大模型自动筛选最优协变量、选择适配的核函数(高斯核、Epanechnikov核)、调整带宽参数,解决传统PSM"调参难、精度低"的问题,适配中小样本经管RCT数据(如50-200个样本)
2.LLM增强合成控制法(SCM):给定一个样本量<50的县域政策评估数据,让Agent调用LLM生成“合成虚拟组”作为对照,解决稀缺样本问题
3.反事实多智能体辩论:搭建“支持者 vs 质疑者”两个Agent,对一个DID结果进行辩论。质疑者提出遗漏变量,Agent自动运行Cinelli-Hazlett敏感性分析,输出鲁棒性阈值
专题五:Agent和LLM经管实证变量测度
课时1:Agent大语言模型赋能网络数据搜集
1.AI Agent驱动的“数据田野调查”——自动化采集与多源融合
2.Agent通过Deep Research on a Loop方法,保证数据搜集质量和可重复性
参考文献: Afonso, S., Galiani, S., Gálvez, R. H., & Sosa, R. A. (2026). Deep research on a loop: Using AI agents to construct economic datasets. NBER Working Paper No. 35188
3.数据搜集案例
(1)实操案例1:Agent自动整理网页数据
(2)实操案例2:Agent自动从全网搜集地级市人工智能创新发展试验区试点信息并构建DID,同事与人工搜集数据进行比对
课时2:Agent大语言模型赋能多模态数据分析
1.Agent大模型分析pdf数据
实操案例3:通过Agent自动从上市公司年报表格提取主要产品名称、年报核心竞争力板块信息
参考文献:戚聿东,孙昌玲,王化成.企业核心竞争力能够降低权益资本成本吗——基于文本分析的经验证据[J].会计研究,2021,(08):94-106.
2.Agent大模型分析文本数据
实操案例4:大语言模型构建实证变量,利用模型从MD&A文本中构建制造业服务化变量
核心方法参考文献:Yimeng, N., Jing, W., Shenyang, J., & Zhibin, J. (2024). The Bullwhip Effect in Servitized Manufacturers. Management Science, 71(1):1-20.03402.
3.Agent大模型自动分析图片数据
实操案例5:大语言模型从图片中提取结构化数据,大语言模型识别CEO面部表情
核心方法参考文献:Momtaz P P. CEO emotions and firm valuation in initial coin offerings: an artificial emotional intelligence approach[J]. Strategic Management Journal, 2021, 42(3): 558-578.
专题六:实证论文全流程自动化与顶刊复现系统
课时1:顶刊复现流程与专业Agent团队配置
1.复现的价值与资源(EJD, Harvard Dataverse)
2.Claude Code复现的6阶段流程:论文摄入、数据审核、代码翻译、结果验证、差异文档化、报告生成
3.配置你的复现Agent团队:领域审稿人、代码审查员、对抗性质疑智能体。设定质量控制容差阈值(系数±0.01,标准误±0.05,p值显著性一致)。
4.实操1:完整复现一篇AER论文。以“The Effect of Pollution on Worker Productivity”为例。
阶段1-2:提示词设计,让Claude Code克隆仓库、安装环境、生成复现计划
阶段3-4:Agent自动运行代码,对比原始结果,生成复现报告,包含差异表(系数、标准误、样本量)、差异解释(因版本或聚类方式不同)
课时2:从自动写作到个人智能体搭建
1.基于Claude Code和AutoGen,搭建一个简易版HLER系统原型,包含:选题→文献综述→数据获取→因果估计→自动写作→模拟审稿流程六大模块
2.赠送百个Skill库:发布并讲解《科研全流程AI Agent Skill宝典》,内含100+经过验证的元认知提示词和Agent配置,覆盖从清洗到写作的方方面面
3.课程总结与未来展望:如何持续迭代你的智能体,探索AI for Science的前沿
4. 课程报名
课程价格
价格:早鸟价1599元(原价:1999)
可按照实际支付金额开具电子发票
价格包含:直播课程+录播回放+课程资料+课程答疑(仅开课前支付能进答疑群)
如有以下优惠,购买前找客服领取优惠券。
优惠一
扫码成为超级课程会员

4. 课程售后
课程发票/课程通知
联系客服可领取课程开课通知、结课证书、可报销发票等证明。

课程退款
在课程未开始前,接受“7天无理由退款”,由于是知识付费,一旦直播课开始后,不接受退款。退款请联系客服。
夜雨聆风