乐于分享
好东西不私藏

全球下载量破20k:StatsPAI 最近到底更新了什么?

全球下载量破20k:StatsPAI 最近到底更新了什么?

从 2026 年 5 月 1 日到 5 月 6 日,StatsPAI 做了一轮比较密集的升级,简单记录一下。

StatsPAI 是斯坦福大学 REAP 团队在做的一个开源 Python 因果推断 / 计量经济学工具包,目标是把 Stata、R 里分散的实证分析方法,整理到一个统一、可复现、也更适合 AI agent 调用的 Python API 里。

这几天主要升级了几块:

  • 更懂研究问题了sp.causal_question 现在可以更直接地路由到 DML、TMLE、meta-learner、causal forest 等方法,不只是跑模型,而是尽量保留对应的识别逻辑和稳健性检查。

  • 更适合写论文和审稿复现了新增了 sp.validation_report()sp.coverage_matrix()sp.reproduce_jss_tables(),方便把数值验证、覆盖率、JSS 论文表格复现直接整理出来。

  • 更重视数值对齐加入了 R / Stata parity harness,也就是系统性检查 StatsPAI 和经典 R、Stata 实现是否对得上。目标不是“看起来能跑”,而是尽量做到可审稿、可复现。

  • IV、RDD、Synth、DML 都做了增强包括弱工具变量诊断、IV 报告包、合成控制导出表格、RDD 新估计器、DML sensitivity / diagnostics 等。

  • GPU / 加速路线更清楚了现在不是宣传“全包 GPU 加速”,而是更诚实地做选择性加速:神经因果模型走 PyTorch CUDA/MPS,HDFE OLS 和大规模 bootstrap 可以走 JAX。

  • 修了一些重要正确性问题比如 CS-DiD 某一路径、Causal Forest BLP、mediation bootstrap 等地方都做了更严格的修复和测试。

简单说,这几天 StatsPAI 做得更佳全面,更加扎实。

开源 repo,欢迎 star、pr:https://github.com/brycewang-stanford/StatsPAI

#因果推断 #计量经济学 #Python #开源项目 #科研工具 #StatsPAI #R #Stata