拒绝AI瞎忽悠!顶刊计量规范,一文吃透不踩雷-AI计量模型错用教学案例集

一、引言：AI在金融顶刊写作中的应用与错用困境

1.1 AI工具在金融实证研究中的普及

在金融实证研究领域，AI早已不是“可选工具”，而是多数研究者离不开的“帮手”。从数据清洗、代码调试到模型设定，国内三大顶刊超六成的实证论文都有AI参与的痕迹，国际顶刊的使用率更是突破七成。大家用AI的场景高度集中：撰写文献综述、处理面板数据、筛选计量模型、运行回归、解读结果，尤其面对大规模数据和棘手的内生性问题时，AI确实能帮着省不少力、避不少麻烦。

1.2计量模型错用的普遍性与隐蔽性

但便利的背后，AI埋下的计量“暗坑”也越来越多。不少学生和研究者的论文里，AI导致的计量错误五花八门，近半数存在不同程度的问题，其中近两成错误直接扭曲了研究结论，让人白费功夫。

更棘手的是，这些错误大多藏得很深。AI的“幻觉”短板，会让它在生成代码时编造虚假计量方法、杜撰不存在的规范，甚至给出完全跑偏的变量定义。比如研究数字金融对企业投资的影响，AI能把核心解释变量错定义成企业自身的金融科技专利数量，而非区域层面的数字金融指数，直接把因果识别逻辑连根带偏，让人误入歧途。

1.3案例集的设计逻辑与结构

本案例集秉持「问题导向、案例驱动、对标规范、实操落地」的思路，专门帮金融专业的同学揪出AI导致的计量错误，避开论文写作中的“雷区”。

案例集分为三个模块：第一模块聚焦AI导致的计量变量错用，拆解4类高频踩坑场景；第二模块针对AI导致的计量模型本身错用，覆盖4种最常见的方法误用；第三模块配套教学工具与课堂练习，帮师生把避坑方法落到实处。

二、AI导致的计量变量（变数）错用教学案例集

案例1 核心解释变量定义幻觉：数字金融对企业投资影响研究

教学场景与错用表现

金融硕士毕业论文写作课上，有同学研究「数字金融对企业投资的影响」，对着复杂的计量设定犯了难，干脆直接给AI甩了需求：「帮我找顶刊里数字金融影响企业投资的核心解释变量测度方法，给我能直接用的Stata代码」。

AI很快给出一套看似专业的方案：把核心解释变量定义成上市公司金融科技专利申请数/总专利申请数，还附上了现成代码。同学图省事，没多琢磨就照搬过来跑回归，最后得出“企业金融科技专利占比越高，投资效率越低”的结论，还暗自窃喜，以为找到了新颖的研究发现。

顶刊规范对照

可对照顶刊的标准范式就会发现，这个定义从根上就跑偏了。这类研究的核心解释变量，必须用区域层面的北大数字普惠金融指数，而非企业自身的专利数据。

这套指数的编制逻辑十分严谨：覆盖全国省市县三级，从覆盖广度、使用深度、数字化程度三个维度合成，依托头部数字金融机构的微观交易数据构建，对单个企业而言完全外生，刚好能破解内生性难题。而企业金融科技专利，顶多只能放在异质性分析中使用，绝对不能当作核心解释变量。

AI幻觉根源

1.概念混淆，胡乱拼接：AI把“区域数字金融发展水平”和“企业金融科技专利”两个毫无关联的概念混为一谈，前者是宏观外生冲击，后者是企业内生行为，本质上毫无交集。

2.因果颠倒，逻辑混乱：AI给出的变量存在严重的双向因果问题——往往是企业投资效率偏低，才会想着申请金融科技专利寻求突破，反过来的逻辑根本不成立。

3.凭空杜撰，误导他人：AI还瞎编“这个方法被顶刊广泛使用”的说法，实则顶刊从未采用过这种变量定义，纯粹是无稽之谈。

4.忽视原则，漏洞百出：完全无视计量学中核心解释变量的外生性要求，区域指数对单个企业是外生的，而企业专利变量则满是内生性隐患。

教学要点

1.核心解释变量的定义，必须严格对标顶刊标杆论文，不能轻信AI的泛化推荐，避免被带偏；

2.要理清变量的经济含义、外生边界和层级匹配规则，切勿混淆核心解释变量与异质性分析变量；

3.AI给出的任何变量定义，都要去顶刊原文中逐一核对，切勿被其杜撰的“规范”误导。

正确操作（Stata标准代码）

stata
* 正确匹配：企业注册地城市-年份层面数字普惠金融指数
merge m:1 city year using 数字普惠金融指数_城市层面.dta, keepusing(pkf_index coverage use_depth digitalization)
keep if _merge==3
drop _merge

* 核心解释变量：城市层面数字普惠金融总指数，标准化处理
egen pkf_std = std(pkf_index)

* 被解释变量：企业实体投资率（购建固定资产、无形资产支付的现金/期初总资产）
gen inv_rate = fixed_asset_pay / lag1_total_asset

* 基准回归
xtreg inv_rate pkf_std size roe leverage soe age board_indep i.year i.industry, fe cluster(stkcd)

案例2 工具变量（IV）错用：高管金融背景对企业债务融资成本影响

教学场景与错用表现

博士高级计量课上，有同学研究「高管金融背景对企业债务融资成本的影响」，卡在了内生性问题上，便找AI索要工具变量和2SLS代码。AI给出同省份同行业有金融背景的高管比例作为IV，同学跑出来的结果显著，顿时喜出望外，直接将其写进了论文。

顶刊规范对照

但顶刊对工具变量的要求，有两条不可逾越的硬杠杠，缺一不可：

1.相关性：IV与核心解释变量必须显著相关，第一阶段F值需大于10，顺利通过弱工具变量检验；

2.排他性约束：IV只能通过核心解释变量影响被解释变量，不能存在任何直接影响的其他渠道。

AI给出的这个IV，直接触碰了排他性约束的红线：同省同行业的高管金融背景比例，会通过行业信贷政策、区域金融环境、同行融资竞争三个渠道，直接影响企业融资成本，是顶刊明确拒绝的无效IV。这类研究中，合格的IV应是高管出生地金融发展水平、高管大学是否就读金融类专业等变量，能严格规避对被解释变量的直接影响。

AI幻觉根源

1.缺失核心假设：AI只从统计学相关性角度推荐IV，完全忽略因果识别的核心——排他性约束，压根没吃透金融顶刊的IV设计逻辑。

2.杜撰规范，误导他人：虚构“这个IV是顶刊标准用法”的说法，一步步把学生引向错误的方向。

3.迎合需求，忽视严谨：只想着给出能跑出显著结果的代码，根本不管能否识别干净的因果效应，刚好戳中了学生急于出成果的心态。

教学要点

1.工具变量的设计，必须先论证排他性约束，再验证相关性，这是顶刊论文的核心门槛；

2.AI给出的任何IV，都要先做排他性的理论论证，不能直接拿来跑回归、用在论文中；

3.要明确：无效IV的回归结果，比不处理内生性的错误更严重，会得出完全虚假的因果结论。

正确操作（2SLS标准代码+顶刊规范检验）

stata
* 第一阶段：核心解释变量（fin_back，高管是否有金融背景）对IV（birth_fin，高管出生地金融发展水平）回归
xtreg fin_back birth_fin size roe leverage soe age board_indep i.year i.industry, fe cluster(stkcd)
est store first

* 弱工具变量检验：第一阶段F值必须>10
testparm birth_fin

* 第二阶段：被解释变量（debt_cost，债务融资成本）对第一阶段拟合值回归
xtreg debt_cost (fin_back=birth_fin) size roe leverage soe age board_indep i.year i.industry, fe cluster(stkcd)
est store second

* 结果输出
esttab first second using iv_result.rtf, se star(* 0.1 ** 0.05 *** 0.01) replace

案例3 控制变量错用：经济政策不确定性（EPU）对企业风险承担的影响

教学场景与错用表现

本科毕业论文指导中，有同学研究EPU对企业风险承担的影响，找AI索要控制变量，AI一口气给出14个，甚至把企业实际控制人股权质押比例、机构投资者持股比例、企业金融化程度都塞了进去。同学不假思索，全部加入模型，结果发现核心变量EPU的系数从显著为正变成不显著，AI还忽悠说“这是控制了遗漏变量，结果更稳健”，同学便信以为真。

顶刊规范对照

但顶刊中这类主题的标准控制变量，只有企业规模、资产负债率、ROE、企业年龄、产权性质、董事会规模、独董比例这几个——全是外生、前定，且不会被EPU直接影响的变量。

AI给出的那几个变量，实则是EPU影响企业风险承担的中介渠道变量，也就是典型的“撞墙变量”。把它们放进基准回归的控制变量中，相当于直接堵死核心因果通道，核心解释变量的变异被中介变量吸收，系数自然变得不显著。这些变量只能用于机制检验，绝对不能当作基准回归的控制变量。

AI幻觉根源

1.变量边界混乱：AI完全不懂因果识别中“撞墙变量”的禁忌，分不清中介变量和控制变量的本质区别，胡乱推荐。

2.唯拟合优度论：只想着提高模型拟合优度，压根不顾及因果识别的逻辑，推荐的变量越多，出错的概率越高。

3.迎合错误认知：刚好踩中了学生“控制变量越多越稳健”的误区，把过度控制包装成更严谨的做法，误导学生。

教学要点

1.控制变量不是越多越好，核心原则很明确：不控制内生变量、不控制撞墙变量、不控制中介路径变量；

2.一定要绘制因果路径图，明确核心解释变量到被解释变量的作用渠道，分清控制变量、中介变量、调节变量的边界；

3.基准回归的控制变量，必须严格对标同主题顶刊标杆论文，不能随意添加AI推荐的变量。

正确操作（基准回归控制变量标准设定）

stata
* 基准回归：EPU对企业风险承担的影响，严格对标顶刊控制变量
* 被解释变量：risk_taking，企业风险承担（3年ROA滚动标准差）
* 核心解释变量：epu，中国经济政策不确定性指数
* 正确的控制变量：前定的企业基本特征
xtreg risk_taking epu size leverage roe soe age board_size board_indep i.year i.industry, fe cluster(stkcd)
est store baseline
esttab baseline using baseline_result.rtf, se star(* 0.1 ** 0.05 *** 0.01) replace

案例4 顶刊论文阅读中的变量解读幻觉：ESG政策暴露度研究

教学场景与错用表现

博士顶刊精读课上，有同学阅读一篇ESG相关顶刊论文时，看不懂核心解释变量ESG Policy Exposure的定义，便找AI帮忙。AI直接将其曲解为“企业ESG评级得分”，还让同学用万得ESG评级直接回归。同学照着操作，却怎么也复刻不出论文结果，AI还甩锅“数据样本不一样”，让同学陷入困惑，始终找不到问题根源。

顶刊原文规范对照

但论文中这个变量的定义，和AI的解读完全是两回事：

ESG Policy Exposure，即企业营收对ESG政策冲击的暴露程度，具体计算方式是：以企业分地区、分行业的营收占比为权重，匹配对应地区-行业的ESG政策强度，通过加权计算得到企业层面的指标。

这个变量设计的核心，就是用外生的政策冲击，破解ESG评级的内生性难题。而企业自身的ESG评级，只是论文中的异质性分析变量，根本不是核心解释变量。AI的错误解读，让学生彻底误解了论文的核心因果逻辑。

AI幻觉根源

1.关键词盲目匹配：AI只看到“ESG”这个关键词，直接忽略了Policy Exposure这个核心限定词，泛化匹配概念，压根没读懂专业术语的精准含义。

2.细节解读能力缺失：混淆了“政策暴露度”和“企业自身ESG表现”两个截然不同的概念，连变量设计的内生性规避逻辑都没理解。

3.甩锅式误导：复刻不出结果时，不反思自身解读错误，反而归咎于样本差异，把学生困在错误认知中无法脱身。

教学要点

1.顶刊论文的变量解读，必须以原文为准，AI的解读只能作为辅助，绝对不能替代原文精读；

2.AI给出的变量定义，必须逐字核对原文的变量定义部分和附录测度说明，确保100%匹配；

3.复刻顶刊结果前，必须先吃透变量的经济含义和测度逻辑，再动手处理数据，避免被AI误导做无用功。

三、AI导致的计量模型本身错用教学案例集

案例5 交错DID模型错用：绿色信贷政策对企业绿色创新影响

教学场景与错用表现

公司金融前沿课上，有同学研究绿色信贷政策对企业绿色创新的影响，因政策是分批实施的，便找AI索要多期DID的Stata代码。AI给出传统的双向固定效应TWFE模型，用`treat×post`交互项作为核心解释变量，还声称这是“顶刊多期DID的标准写法”。同学跑出来的结果显著，便直接采用，可投稿时被编辑直接拒稿，理由是“方法过时，不符合当前顶刊规范”。

顶刊规范对照

如今顶刊中，交错DID场景下的传统TWFE模型早已被淘汰。常用的Goodman-Bacon分解早已表明：交错DID中，传统TWFE估计量是多个2×2 DID的加权平均，其中包含“已处理单位作为控制组”的无效对比，一旦处理效应存在异质性，估计量就会出现严重偏误，甚至会得出与真实结果相反的符号。

当前顶刊对交错DID的强制规范的是：

1.必须做Goodman-Bacon分解，验证处理效应异质性的影响；

2.必须采用CSDID、SA、DIDM这类异质性稳健DID估计量，替代传统TWFE模型；

3.必须做动态平行趋势检验，可视化政策的动态效应，检验预期效应和滞后效应。

AI幻觉根源

1.训练数据滞后：AI的训练数据大多停留在2021年之前的老范式，没能跟上计量方法的前沿进展和顶刊规范的更新。

2.核心逻辑模糊：只从基础计量理论给出TWFE模型，完全不理解异质性处理效应带来的估计偏误问题。

3.重结果轻严谨：只想着给出能跑出显著结果的代码，根本不管方法能否干净识别因果效应。

教学要点

1.交错DID场景下，传统TWFE模型已被顶刊淘汰，必须采用异质性稳健估计量；

2.AI给出的计量模型，必须核对近3年顶刊的方法规范，杜绝使用过时方法；

3.计量模型的选择，核心是“能否干净识别因果效应”，而非“能否得到显著结果”。

正确操作（顶刊规范CSDID异质性稳健DID代码）

stata
* 安装异质性稳健DID命令
ssc install csdid, replace
ssc install drdid, replace

* 核心变量设定
* gvar：政策实施分组变量，从未实施政策的企业gvar=0，实施政策的企业gvar=首次实施年份
* year：年份变量
* treat：政策处理变量，实施政策后treat=1，否则=0
* 被解释变量：green_inno，企业绿色专利申请数量
* 控制变量：size leverage roe soe age board_indep

* 1. Goodman-Bacon分解，检验异质性处理效应
bacondecomp green_inno treat size leverage roe soe age board_indep, ddetail absorb(i.industry i.year) robust

* 2. CSDID异质性稳健DID估计（顶刊标准）
csdid green_inno size leverage roe soe age board_indep, ivar(stkcd) time(year) gvar(gvar) method(dripw)

* 3. 动态平行趋势检验与可视化
estat event, window(-5 3)
csdid_plot, title("绿色信贷政策的动态效应") xlabel(-5 "-5期" -4 "-4期" -3 "-3期" -2 "-2期" -1 "-1期" 0 "政策当期" 1 "1期" 2 "2期" 3 "3期") yline(0, lcolor(red))

* 4. 结果输出
estat simple
estat group

案例6 固定效应模型错用：银行竞争对企业信贷融资影响

教学场景与错用表现

实证金融课上，有同学研究银行竞争对企业信贷融资的影响，找AI索要面板固定效应模型的Stata代码。AI给出的代码只控制了行业固定效应+年份固定效应，未控制企业个体固定效应。同学疑惑地询问是否需要添加企业固定效应，AI却回复“控制了行业固定效应就不需要控制企业固定效应，否则会过度控制”。同学按照这个建议跑回归，结果高度显著，可答辩时被评委直接指出“固定效应设定错误，结果完全不可靠”。

顶刊规范对照

公司金融面板数据的顶刊标准规范，有三条铁则：

1.基准回归必须采用企业个体固定效应+年份固定效应（双向固定效应）。企业个体固定效应能吸收所有不随时间变化的企业异质性（如产权性质、注册地、行业属性等），是解决遗漏变量偏误的核心；

2.行业、省份固定效应，仅在未控制企业个体固定效应时使用；控制企业固定效应后，不随时间变化的行业、省份固定效应会被完全吸收，无需额外添加；

3.标准误必须聚类到企业层面，解决面板数据的序列相关问题，绝对不能只聚类到行业层面，否则会导致t值虚高，出现虚假显著。

AI幻觉根源

1.经济含义误解：混淆了个体固定效应和行业固定效应的作用边界，连固定效应模型的基本原理都没搞懂。

2.顶刊范式无知：只从纯计量理论给出模型设定，完全没考虑公司金融实证研究的通用规范。

3.聚类逻辑混乱：不理解标准误聚类的核心作用，无法识别聚类维度错误导致的虚假显著性。

教学要点

1.公司金融面板数据的基准回归，企业+年份双向固定效应是顶刊的最低要求，必须严格遵守；

2.要明确不同维度固定效应的作用：个体固定效应吸收不随时间变化的个体异质性，年份固定效应吸收宏观冲击，高维固定效应（行业×年份、省份×年份）仅能用于稳健性检验，不能替代基准的双向固定效应；

3.标准误聚类维度必须与固定效应维度匹配，公司金融面板数据默认聚类到企业层面。

正确操作（顶刊规范双向固定效应模型代码）

stata
* 双向固定效应模型：企业个体固定效应+年份固定效应
* 被解释变量：loan，企业信贷融资规模（总负债/总资产）
* 核心解释变量：bank_comp，企业注册地城市层面银行竞争程度（HHI指数）
* 控制变量：size roe leverage soe age growth board_indep
* 顶刊标准设定：企业个体固定效应i.stkcd，年份固定效应i.year，标准误聚类到企业层面
xtset stkcd year
xtreg loan bank_comp size roe leverage soe age growth board_indep i.year, fe cluster(stkcd)
est store fe_model
esttab fe_model using fe_result.rtf, se star(* 0.1 ** 0.05 *** 0.01) replace

案例7 Heckman两阶段模型错用：企业社会责任对债券发行利率影响

教学场景与错用表现

高级计量课上，有同学研究企业社会责任对债券发行利率的影响，认为只有部分企业发行债券，存在样本自选择问题，便找AI索要Heckman两阶段模型的Stata代码。AI给出的代码中，第一阶段选择方程和第二阶段主回归的变量完全一致，未设置任何排除限制变量。同学跑出来的逆米尔斯比（IMR）系数不显著，AI还忽悠说“这说明不存在自选择偏误，基准回归结果稳健”，同学便信以为真。

顶刊规范对照

Heckman模型能够使用的核心前提，是必须设置排除限制变量：第一阶段选择方程中，至少要有一个变量，仅影响企业“是否发行债券”的二元选择，不直接影响单只债券的发行利率——这是模型能够识别的核心前提，缺少这一前提，Heckman模型完全不成立。

顶刊的标准操作是：

1.第一阶段用probit模型回归企业是否发债的二元变量，计算逆米尔斯比IMR；

2.第二阶段将IMR加入主回归，若IMR系数显著，说明存在样本自选择偏误，必须用Heckman模型修正；

3.这类研究中，标准的排除限制变量是“同省份同行业债券发行企业比例”，仅影响企业发债决策，不直接影响债券发行利率。

缺少排除限制变量的Heckman模型，顶刊完全不认可；IMR系数不显著，并非没有自选择偏误，而是模型设定错误导致的。

AI幻觉根源

1.缺失核心识别假设：完全不理解排除限制变量是Heckman模型的核心，只给出模型形式，却忽略了识别逻辑。

2.杜撰规范误导：虚构“排除限制变量不是必须的”这一错误说法，误导学生走入误区。

3.结果解读错误：将模型设定错误导致的IMR不显著，曲解为“没有自选择偏误”，完全颠倒黑白。

教学要点

1.Heckman两阶段模型的核心，是排除限制变量的设计，缺少有效排除限制变量的Heckman模型，顶刊完全不认可；

2.必须先论证排除限制变量的有效性，再运行模型，不能直接使用AI给出的无排除限制的代码；

3.要明确：Heckman模型不是解决自选择问题的万能药，模型设定错误会导致比不修正更严重的偏误。

正确操作（顶刊规范Heckman两阶段模型代码）

stata
* Heckman两阶段模型，解决样本自选择偏误
* 第一阶段选择方程：被解释变量issue_dum（是否发行债券，1=是，0=否）
* 排除限制变量：bond_ratio（同省份同行业债券发行企业比例），仅在第一阶段出现
* 第二阶段主回归：被解释变量bond_rate（债券发行利率），核心解释变量csr（企业社会责任得分）
* 顶刊标准两步法代码

* 第一步：probit选择方程，计算逆米尔斯比IMR
probit issue_dum csr bond_ratio size roe leverage soe age growth i.year i.industry, robust
predict imr, xb
gen imr = normalden(imr)/normal(imr) if issue_dum==1

* 第二步：主回归加入IMR，修正自选择偏误
reg bond_rate csr imr size roe leverage soe age bond_term bond_rating i.year i.industry, robust cluster(stkcd)
est store heckman
esttab heckman using heckman_result.rtf, se star(* 0.1 ** 0.05 *** 0.01) replace

案例8 中介效应模型错用：数字金融对企业全要素生产率影响机制检验

教学场景与错用表现

本硕毕业论文写作中，有同学研究数字金融对企业全要素生产率的影响机制，找AI索要中介效应检验方法。AI给出Baron-Kenny三步法，还声称这是“顶刊机制检验的标准方法”。同学照着操作，跑出来显著的中介效应结果，可投稿时被审稿人直接指出“中介效应方法过时，未处理内生性，机制检验无效”。

顶刊规范对照

如今顶刊中，Baron-Kenny三步法早已基本被淘汰。这种方法仅能检验变量间的相关性，根本无法识别因果机制，且未处理中介变量的内生性问题，很容易得出虚假的中介效应结论。

当前顶刊认可的机制检验方法是：基于外生冲击的分组检验、渠道变量的交互项检验、有排他性约束的因果中介分析。机制检验的核心，是论证“核心解释变量→中介变量→被解释变量”的因果链条，而非单纯追求统计上的显著性。

AI幻觉根源

1.方法更新滞后：AI的训练数据中，大量本硕论文使用三步法，便误以为这是顶刊规范，完全不了解顶刊范式的更新。

2.因果逻辑无知：将相关性检验等同于因果机制检验，根本没理解机制检验的核心是因果链条的论证。

3.迎合学生需求：三步法操作简单、容易跑出显著结果，刚好迎合了学生急于出成果的需求，放大了方法错用的风险。

教学要点

1.顶刊机制检验的核心，是因果机制的论证，而非统计上的三步法显著性；

2.一定要绘制机制路径图，从理论上论证核心解释变量对中介变量、中介变量对被解释变量的影响，排除其他替代渠道；

3.优先采用分组检验、交互项检验这类顶刊认可的方法，替代过时的三步法。

正确操作（顶刊规范机制检验交互项法代码）

stata
* 顶刊规范机制检验：交互项法，验证融资约束的中介渠道
* 理论逻辑：数字金融通过缓解企业融资约束，提升企业全要素生产率
* 核心变量：
* 被解释变量：tfp，企业全要素生产率（LP法计算）
* 核心解释变量：pkf，数字普惠金融指数
* 机制变量：sa，企业融资约束（SA指数，绝对值越大，融资约束越严重）
* 交互项检验：数字金融对融资约束更严重的企业，提升效应更强，验证渠道有效性

xtreg tfp c.pkf#c.sa pkf sa size roe leverage soe age i.year i.industry, fe cluster(stkcd)
est store mechanism
esttab mechanism using mechanism_result.rtf, se star(* 0.1 ** 0.05 *** 0.01) replace

* 结果解读：若交互项系数显著为负，说明融资约束越严重的企业，数字金融对TFP的提升效应越强，验证了融资约束的渠道作用

四、教学配套工具与课堂练习

4.1 AI计量错误识别Checklist（学生自查用）

检查维度	核心检查项	顶刊规范要求	AI易犯错误
变量设定	核心解释变量定义	100%匹配顶刊标杆论文，经济含义清晰，外生性可论证	虚构变量定义、混淆概念、忽视内生性
工具变量设计	同时满足相关性（F>10）和排他性约束	只看相关性、忽视排他性、弱工具变量
控制变量选择	外生、前定、不控制撞墙变量	过度控制、包含中介变量、遗漏关键变量
模型设定	固定效应维度	公司金融默认企业+年份双向固定效应	遗漏个体固定效应、错误使用行业固定效应
DID模型	交错DID必须用异质性稳健估计量	用过时的TWFE模型、忽视异质性检验
内生性处理	IV、Heckman等方法必须满足识别假设	违反核心假设、缺少排除变量、检验不充分
标准误聚类	聚类到个体层面（企业/城市）	聚类维度错误、未聚类、过度聚类
AI幻觉防范	规范真实性	所有方法必须对标顶刊原文	虚构顶刊规范、张冠李戴、方法过时
代码规范	语法正确性	代码可运行，逻辑符合理论	语法错误、逻辑错误、版本不兼容
结果解释	经济意义	结果符合理论预期，经济含义合理	结果矛盾、过度解读、经济意义荒谬

4.2课堂练习设计

1.错误识别练习：给学生提供AI生成的错误计量代码与变量设定，让学生找出其中的错误，对照顶刊规范修正，写出正确的代码；

2.顶刊复刻练习：给学生一篇顶刊论文，让学生先用AI解释论文的计量设定，再对照原文核对AI的解读错误，最终完成论文结果的复刻；

3.幻觉防范练习：让学生针对自己的论文主题，向AI提问获取计量方案，再分组讨论AI方案中的幻觉风险，最终形成符合顶刊规范的实证设计。