一篇论文写完,点下“Submit”,你看到的是一个上传成功的页面。
期刊编辑看到的却像另一幅画面:稿件一份份落进收件箱,系统开始找审稿人,审稿人要在教学、项目、实验和会议之间挤出时间,把别人的工作从头看到尾。生成式 AI 让写作更快之后,这条本来就不宽的通道,会先变得更聪明,还是先变得更拥挤?
标题:More Versus Better: Artificial Intelligence, Incentives, and the Emerging Crisis in Peer Review
作者:Claudine Gartenberg、Sharique Hasan、Alex Murray、Lamar Pierce
机构:The Wharton School, University of Pennsylvania;Duke University;University of Oregon;Washington University in St. Louis
发布时间:2026-04-27(Organization Science 在线发表)
原文链接:https://doi.org/10.1287/orsc.2026.ed.v37.n3
投稿按钮变轻了,评审链条没变短
在学术世界里,论文不是写完就算抵达终点。
它还要经过编辑初筛、同行评审、修改、再判断。同行评审可以理解成餐馆出菜前那道试味:厨师很多,菜单也越来越长,但真正能尝出火候的人并不会因为厨房上了新机器就自动翻倍。
生成式 AI 改变的,首先是写作端的摩擦。
摘要可以更快润色,框架可以更快搭,回应审稿意见也能更快起草。单看一个作者,这像省时间;放进整个投稿系统里,问题就变了。如果每个人都更容易多投一篇,编辑和审稿人收到的不会是“同样多但更精致”的稿子,也可能是“更多还没磨透”的稿子。
这篇论文抓住的,正是这个岔路口。
他们翻了五年的投稿和评审
作者没有只问“AI 会不会帮科研”。他们把镜头对准一本期刊的完整流程记录。
论文分析了 Organization Science 从 2021 年 1 月到 2026 年 2 月的首轮投稿与文字评审:一共 6,957 篇投稿,涉及 11,887 位作者;这些稿件对应 10,389 份评审,来自 2,519 位不同审稿人。
这个规模的好处,是它能同时看见两边。
左边是投稿。论文摘要有没有越来越像 AI 生成文本,投稿量有没有变化,文字质量有没有一起走高。右边是评审。审稿意见里 AI 痕迹怎么变,评审质量有没有跟着改善。像看一条双向车道,不能只数开进来的车,还得看收费站和出口有没有一起扩容。
论文给出的图景不太轻松:自 ChatGPT 发布后,这本期刊的投稿量上升了 42%,而论文观察到的写作质量并没有一起变好,反而出现下降。更细看,AI 使用在投稿端继续增加;评审端的 AI 使用也在早期上升,但到了后面没有显示出同样的持续攀升和质量回报。
问题就露出来了。

“更多”会自己奖励自己
这件事不能只怪一个工具。
论文把矛头指向激励。学术系统很容易奖励可见的产出:投稿数、论文数、项目竞争、履历上的新条目。生成式 AI 像把传送带的入口电机换强了。如果考核仍然偏爱“多”,人就会自然把省下来的时间拿去多生产,而不是每次都拿去多打磨。
这和外卖店高峰期很像。
下单按钮越来越顺,厨房接单量冲上去。可厨师、出餐台和骑手没有同步增加时,系统未必把每份餐做得更好,最先出现的往往是等待、返工和匆忙。投稿系统里的返工更隐蔽:编辑筛稿更累,审稿邀请更难发,认真评审的注意力被切得更碎。
所以论文标题里的 `More Versus Better` 不是一句修辞。
它是在问:当 AI 让科研写作更省力,制度最后把这份省力导向哪里?导向更扎实的问题、更透明的方法和更清楚的证据,还是导向一台更勤快的投稿机?
审稿意见也能生成,但信任不能批量打印
有人会说,那就让 AI 也帮忙审稿。
它当然可以做一些事。查语句、列问题、提醒结构缺口、帮助审稿人整理要点,这些都不神秘。可同行评审最难的部分,往往不是把一段话写得像评审意见,而是判断研究设计哪里真的站不住,证据是否支持结论,方法上的小洞会不会让整个故事漏气。
这需要责任。
一份评审意见不是评论区回复。它会影响作者的时间、编辑的决定和一项研究能否进入公共知识库。文本可以批量生成,愿意为判断负责的人不能批量生成。

这不是一本期刊替整个学界下结论
话也要说稳。
这篇论文研究的是一本管理学期刊的投稿与评审记录,不等于每个学科、每家期刊、每种 AI 使用方式都会走出同一条曲线。它还依赖 AI 文本检测器来估计使用痕迹,检测器能提供线索,却不是给每一段文字盖章定案的法官。
而且,AI 不是天然站在“坏稿件”一边。
对于语言表达受限的作者,好的写作辅助可能降低门槛;对于认真做研究的人,工具也可能把时间从改句子挪回改问题。关键在于,系统到底奖励什么。奖励深一点的思考,工具就可能帮人把力气用在刀刃上;只奖励更快更多,工具会把那条旧路跑得更快。
投稿按钮不会自己变重。
真正要被重新设计的,是它后面的规则:编辑如何筛选,期刊如何要求披露,机构如何评价研究者,审稿劳动如何被尊重。否则 AI 省下来的那点时间,可能不会变成更好的论文。
它会先变成下一封更快抵达的投稿邮件。
夜雨聆风