
《自然》《科学》同时发出警告
当你读到一篇“学术论文”的参考文献时,有没有想过——这些被引用的文献,可能根本不存在?
这并非危言耸听。2026年4月初,《自然》和《科学》同时发声,警告AI大模型的“幻觉”缺陷正被系统化利用,批量生成带有伪造数据、“幽灵文献”的科研论文,对学术出版、基金评审和科学传承构成了系统性污染风险。
1
何为“幽灵文献”?AI何以“无中生有”?
2026年初,法国图卢兹大学的计算机科学家纪尧姆·卡巴纳克收到了一封来自谷歌学术的通知——他的文章被《国际牙科杂志》的一篇论文引用了。
这让他困惑不已。他自己的研究与牙科毫无关联,那篇被引文章他毫无印象。他推测,这条引文极可能是AI凭空杜撰的幻觉。经调查,AI生成了一篇完整的假论文,把卡巴纳克的真实姓名、一个虚假的论文标题和“Nature”期刊组合在一起,生成了一个根本不可能存在的“幽灵文献”。
2
数据触目惊心:数万篇论文被污染
个案背后,是系统性危机。《自然》杂志与英国Grounded AI公司的独家分析表明,2025年至少有数万篇期刊论文、专著及会议记录可能掺杂AI生成的“幻觉引文”。
多组数据揭示了问题的严重性:
一项针对三场计算机科学会议近1.8万篇论文的分析显示,无法溯源至实际出版物的参考文献数量激增。2025年已有2.6%的论文至少包含一条“幻觉引文”,相比2024年的0.3%增长了近9倍。
另一项覆盖2.2百万条引文的大规模审计研究发现,2025年顶级AI/ML和安全会议中,含无效或伪造引文的论文数量比前一年增长了80.9%。
在对10个主流大语言模型的测试中,不同模型生成的引用虚假比例从11.4%到56.8%不等,跨度惊人。而在生物医学领域,AI生成参考文献中的虚假引用比例曾高达90%。有研究更发现,AI生成的文章中仅有7%的参考文献是准确的。
AI的“幻觉”已不仅局限于生成假文献。 在ICLR 2026的投稿中随机抽取300篇论文,竟有50篇存在严重AI幻觉问题,包括伪造参考文献、捏造作者信息,甚至编造实验数据。更令人震惊的是,部分含AI幻觉的论文竟在同行评审中获得均分8.0的高分,具备冲击顶会口头报告的潜力。在NeurIPS 2025已发表的论文中,同样发现了53篇含完全虚构引文的论文。
3
为何说这是“系统性污染”?
AI能批量生成“假论文”,已从个案演变为系统性风险。清华大学孙茂松团队研究揭示,问题根源在于不到0.1%的“H-神经元”在预训练阶段形成的错误关联,在特定提示下会生成系统性虚假信息。而《自然》的测试更暴露了行业“潜规则”——13个主流大模型在多轮对话诱导下全部“沦陷”,均可配合生成虚假学术论文。
最危险的是,这种缺陷正被“精准利用”。AI能生成完整的虚假论文信息——标题、作者、期刊、卷期页码,甚至DOI编号。还能编造符合统计规律的“实验数据”,附带p值、置信区间等专业指标,通过传统数据校验。生成的论文结构严谨、语言流畅,精准匹配学术范式,使同行评审难以识别。
“幽灵文献”一旦混入学术体系,将成为后续研究的“污染源”,形成错误引用链,破坏科学知识的积累与传承。
4
学术圈震动:顶会用行动说“不”
面对污染,学术圈已开始行动。
2025年11月,ICLR(国际表征学习大会)的评审平台OpenReview出现严重漏洞,导致近万篇论文的作者及审稿人相关数据被窃取并在网络广泛传播,成为同行评议数据泄露事件中规模最大的案例之一。
2026年3月,ICML(国际机器学习大会)震惊学界——一次性“桌拒”497篇论文,占总投稿量的2%。原因是这些论文的作者在对其他论文进行同行评审时违反了AI使用政策。大会在提交的PDF论文中隐藏了“水印”,通过水印诱导AI在生成的审稿意见中留下特定标记,精准识别出违规行为。这释放了一个明确信号:学术共同体正以强硬姿态捍卫评审的严肃性。
5
如何保护学术文献不被“污染”?
面对这场系统性危机,各方正在构建防御体系。
技术上, 德国柏林自由大学的研究者编写脚本对Crossref数据库中的引文交叉比对,已筛出500余篇存疑文献。法国国家科研中心团队推出免费工具bibCheck,精准比对引文是否指向真实文献。前沿出版集团已开发内部AI筛查工具,用于稿件初审阶段标记“幻觉引文”。
制度上, 期刊正强化AI使用规范。国内18家大模型厂商联合发布AI全链条自律标准,部分期刊已要求作者提交数据溯源证明和AI使用声明。卡巴纳克明确指出,含有“幻觉引文”的论文绝不应出现在学术殿堂,一经发现,出版方应立即发布声明,并视情况启动更正或撤稿程序。
6
写在最后:你我该如何应对?
对科研人员来说,面对这场正在蔓延的污染,需要建立三道防线:
第一道防线是自查。 使用AI辅助写作后,必须逐条核对参考文献——确认每一篇文献在数据库中真实可查。即便AI生成的内容“看起来很专业”,也不能代替人工验证。
第二道防线是工具辅助。 利用bibCheck、Check If Exist等开源工具自动筛查可疑引文。技术可以成为应对技术污染的有力武器。
第三道防线是共同体监督。 发现“幽灵文献”后,通过PubPeer等学术评议平台公示存疑文献,让学术共同体共同维护文献纯净。
正如《科学》杂志评论所言:“当AI能完美模仿科学研究的外在形式,我们更需坚守科学精神的内核——求真。”AI幻觉污染的警钟已经敲响,守护科学文献的纯净,需要每一位科研人行动起来。
扫码添加微信,即可获得:
①个性化刊物推荐:深度分析您的研究,推荐3-5本高契合度sci期刊。
②内部动态早知道:优先获取新收录期刊、审稿政策变化、特刊征稿等信息。
③一对一答疑解惑: 针对您的具体论文和发表目标,提供针对性建议。
为公众号读者特别开放【免费】咨询服务!仅限前10位哦,先到先得!

夜雨聆风