你打开一篇论文,多半是这样:下载 PDF,放大缩小,搜索关键词,看到公式时皱一下眉,看到方法部分时再皱一下眉。论文像一张精心整理过的合影——结论被摆在最显眼的位置,数据和代码挤在角落,真正发生过的研究过程,被压成几页文字概述。
AI 来了之后,这种格式的尴尬被放得更大。现在的研究越来越离不开数据、模型、脚本、版本和计算环境,而静态论文只能告诉你"我们这样做了",没办法让你当场验证"是不是真的这样做了"。文章在期刊里,实验在硬盘里;评审专家手上拿到的是一份说明书,但摸不到那台机器。
论文开始像一个可运行的现场
可执行论文(executable paper)想接上的,就是这道断裂。它做的事不是把代码附在文末交差,而是把叙述文字、原始数据、分析脚本、图表生成过程和运行环境一起打包进一个能交互的研究空间。读者翻到结果那一节,不必再停留在"作者声称稳健"这一行字面上——可以把某个参数改掉、重新跑一遍分析、看图表跟着如何变化。评审专家也不必只盯着方法部分的自然语言去揣测,而是直接打开计算过程本身。
Jupyter Notebook、R Markdown、Quarto、Curvenote 这些工具,已经把这种写作方式推到学术出版的门口。它们做的事其实就一件:让"写论文"和"做分析"之间少一堵墙。过去的论文像研究结束以后的陈列柜——展品摆好了,灯光打好了,参观者只能隔着玻璃看;未来的论文更像研究现场的一扇玻璃门,你不光看得到里面,理论上还可以推开门进去,自己动手摸一摸。

机器可读,不是给人类退场
可执行论文顺带还触发了一个更深的变化——它让论文变成了"机器可读"的东西。这四个字听上去像要把人类学者请到一边去,其实正好相反。自然语言写作很擅长讲故事,但也容易留下含糊的缝隙;而数据列名、代码版本、统计检验、图表来源这些细节,如果能以结构化的方式写进论文,AI 代理就可以帮人类做那些耗时、琐碎、偏偏又很关键的核对工作。
举个例子,一篇论文声称某个模型显著优于基线,机器可读的版本可以让评审代理顺着数据、代码、图表之间的关系一路追下去。研究问题本身重不重要,这种判断还是要交给人类;但"这张图到底怎么画出来的、参数有没有被悄悄换过、样本和结论对不对得上",这类核查 AI 反而做得又快又稳。
PDF不会立刻消失,但权力会移动
当然,PDF 不会明天就从学术界蒸发。它轻便、稳定、好引用、好归档,这些优点一时半会儿没人能替代——但它原本"舞台中央"的位置会被慢慢挤偏。研究越是计算密集、数据驱动、依赖模型,就越需要把结论背后那一整套过程打开来给人看。
这件事不只关出版商的事。作者要交的将不只是一份漂亮的文本,还要附上可复现的整套工作流;出版平台也不能停留在排版和分发,得开始托管环境、检查依赖、维护数据入口;同行评审则会从"读完判断",逐步加进"打开运行一下试试"这道工序。

真正值得期待的,其实不是论文做得更花哨,而是它变得更诚实一点。读者看到的,不再只是那张端正得有些用力的成品照,还能看见桌上的草稿、工具、刻度、和那些没被擦掉的误差。科学传播的下一站,也许就是这样一个可以被打开、可以跑起来、也可以被追问的研究现场。
夜雨聆风