
接着“1.学术界的Vibe Coding时刻来了! 10个agents全自动跑完一篇论文.”“2.MIT教授搞了个论文工厂! 多智能体跑完了整条社科研究流水线, 产出的实证论文都很不错.”
最近,Alex Imas提到,ML/AI方法将逐渐进入经济学研究生的标准课程体系。该判断并非对技术潮流的泛泛观察,背后已经有越来越具体的研究进展作为支撑。
宾夕法尼亚大学经济系教授Jesús Fernández-Villaverde(JFV)的一篇新工作论文,正好提供了一个很好的例证。
Imas如今同时担任Google DeepMind的AGI经济学总监和芝加哥大学Booth商学院教授。他对经济学与AI交叉方向的判断,自然会被学界认真对待。
此次,Imas转发的是JFV的新论文,题为《The Blessings of Overparameterization: Applications in Solving Economic Models》《过参数化的益处:在求解经济模型中的应用》。
论文标题本身就很有冲击力。
在传统统计学训练中,过参数化通常带有负面含义。它容易让人想到模型过度复杂、样本外表现不佳、过拟合严重,也会让推断变得更加困难。按照传统的理解,参数太多往往意味着风险的上升。
但JFV偏偏把过参数化称为益处。
该说法背后,对应的是深度学习领域近年来发现的一个重要现象,即双重下降(double descent)。
传统统计学中,一个核心信条是偏差-方差权衡(bias-variance tradeoff)。模型复杂度提高后,训练误差通常会下降,但测试误差会先下降、后上升,并在中间形成一个最优参数规模。超过该规模,模型就容易走向过拟合。
深度学习研究却发现,模型参数量继续大幅增加,甚至远超训练样本数量后,测试误差可能再次下降,有时还能低于传统意义上的最优点。双重下降由此得名。模型在高度过参数化之后,反而重新获得了良好的泛化能力。
JFV的工作,就是把该现象带入经济模型求解。论文的核心结论是,在求解动态随机一般均衡(DSGE)模型、异质性主体模型等复杂经济模型时,过参数化的深度神经网络不仅能够缓解传统方法面临的维度诅咒,还能在高维问题上达到传统方法难以企及的精度。
不过,Imas也提醒,不能只是把任务交给AI agents自行运行。正如JFV和Kahou所展示的,只有理解工具的结构和工作原理,研究者才能用一种真正对经济学有价值的方式进行创新。
由此也能看到,工具使用者与工具掌控者之间,存在真实距离。
AI agents可以帮研究者实现一个已知方法。但如果缺乏对过参数化原理的理解,研究者很难想到把它用于经济模型求解;如果不理解双重下降机制,也很难判断什么时候该使用神经网络,什么时候该沿用传统的Chebyshev多项式逼近法。
因此,Imas真正强调的并非“AI工具很好用”那么简单。更深层的含义在于,ML/AI方法正在从炫技工具转向经济学研究的基础能力储备。
未来,理解相关方法的人,会获得新的研究空间;长期忽视相关方法的人,则可能逐渐被甩在后面。
这对经济学研究生意味着什么?
目前国内绝大多数经济学博士项目的核心课程仍然是计量方法(OLS、IV、DID、RDD)加微观/宏观理论。少数项目引入了机器学习方法,但往往作为选修或补充。
Imas的判断可能意味着,现有训练格局会发生变化。变化幅度也许远不止多开一门选修课那么简单。在他的判断中,ML/AI方法将成为几乎所有实证与分析工作的必要基础。
对当下的经济学研究生而言,至少有几点值得认真考虑。
第一,把Python和PyTorch真正当作第二门计量语言来学。目标不能停留在代码能跑,要能够看懂神经网络的基本架构、训练逻辑、损失函数、优化过程以及模型为何有效。
第二,持续关注计量方法与机器学习的交叉领域。双重机器学习(DML)、因果森林(Causal Forest)、高维变量选择,以及Lasso/Ridge在工具变量和控制变量选择中的应用,都会越来越接近应用经济学研究的核心地带。
第三,系统阅读JFV关于深度学习的系列研究。他的NBER工作论文《Deep Learning for Solving Economic Models》是一个很好的起点。论文配套代码完整,也已经进入哈佛、普林斯顿等高校的相关课程训练之中。对想理解AI如何改变经济模型求解的学生而言,它比泛泛讨论AI趋势更值得投入时间。
*群友可以到计量社群下载AI agents论文工厂完整版操作指南,真的太强悍无敌了。
1.最全! 我国适合"断点回归"的政策都整理出来了, 让你有做不完的RDD断点政策评2.最全! 我国适合"合成控制法"的政策都整理出来了, 让你有做不完的SCM政策评估3.最全106页! 我国适合DID双重差分的政策都整理出来了, 让你有做不完的DID政策4.最全! 我国适合DDD三重差分的政策都整理出来了, 让你有做不完的DDD政策论5.最全! 国内哪些政策适合用队列DID, 模糊断点RDD, 双重机器学习DML进行评估?6.最全! 国内哪些政策情景适合用Bartik IV, 空间DID, 模糊DID方法进行评估?
7.最全! 我国各种X的工具变量IV都整理出来了, 8.最全! 把CFPS研究过的全部自变量X与因变量Y做成数据库了, 全网第一份CFPS选题数据库.9.最全! 把CHFS研究过的全部自变量X与因变量Y做成数据库了, 第一份CHFS金融选题数据库.10.中国健康与养老CHARLS选题库, X与Y的研究组合助你研究老年人问题.11.把CSMAR研究过的自变量X与因变量Y做成数据库了, 第一份公司与金融微观选题数据库.12.三农微观数据选题库, 从此AI轻易助你选择经过检验了的X与Y的不同组合选题.13.CHIP和CEPS选题数据库, 轻松助你选择经过检验了的X与Y的不同组合家庭收入和教育选题.
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
8年,计量经济圈近2500篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle

夜雨聆风