警惕!AI“幻觉”正在污染科学文献,数万篇论文已中招

文末扫码领取更多详细资料~

《自然》《科学》同时发出警告

当你读到一篇“学术论文”的参考文献时，有没有想过——这些被引用的文献，可能根本不存在？

这并非危言耸听。2026年4月初，《自然》和《科学》同时发声，警告AI大模型的“幻觉”缺陷正被系统化利用，批量生成带有伪造数据、“幽灵文献”的科研论文，对学术出版、基金评审和科学传承构成了系统性污染风险。

何为“幽灵文献”？AI何以“无中生有”？

2026年初，法国图卢兹大学的计算机科学家纪尧姆·卡巴纳克收到了一封来自谷歌学术的通知——他的文章被《国际牙科杂志》的一篇论文引用了。

这让他困惑不已。他自己的研究与牙科毫无关联，那篇被引文章他毫无印象。他推测，这条引文极可能是AI凭空杜撰的幻觉。经调查，AI生成了一篇完整的假论文，把卡巴纳克的真实姓名、一个虚假的论文标题和“Nature”期刊组合在一起，生成了一个根本不可能存在的“幽灵文献”。

数据触目惊心：数万篇论文被污染

个案背后，是系统性危机。《自然》杂志与英国Grounded AI公司的独家分析表明，2025年至少有数万篇期刊论文、专著及会议记录可能掺杂AI生成的“幻觉引文”。

多组数据揭示了问题的严重性：

一项针对三场计算机科学会议近1.8万篇论文的分析显示，无法溯源至实际出版物的参考文献数量激增。2025年已有2.6%的论文至少包含一条“幻觉引文”，相比2024年的0.3%增长了近9倍。

另一项覆盖2.2百万条引文的大规模审计研究发现，2025年顶级AI/ML和安全会议中，含无效或伪造引文的论文数量比前一年增长了80.9%。

在对10个主流大语言模型的测试中，不同模型生成的引用虚假比例从11.4%到56.8%不等，跨度惊人。而在生物医学领域，AI生成参考文献中的虚假引用比例曾高达90%。有研究更发现，AI生成的文章中仅有7%的参考文献是准确的。

AI的“幻觉”已不仅局限于生成假文献。在ICLR 2026的投稿中随机抽取300篇论文，竟有50篇存在严重AI幻觉问题，包括伪造参考文献、捏造作者信息，甚至编造实验数据。更令人震惊的是，部分含AI幻觉的论文竟在同行评审中获得均分8.0的高分，具备冲击顶会口头报告的潜力。在NeurIPS 2025已发表的论文中，同样发现了53篇含完全虚构引文的论文。

为何说这是“系统性污染”？

AI能批量生成“假论文”，已从个案演变为系统性风险。清华大学孙茂松团队研究揭示，问题根源在于不到0.1%的“H-神经元”在预训练阶段形成的错误关联，在特定提示下会生成系统性虚假信息。而《自然》的测试更暴露了行业“潜规则”——13个主流大模型在多轮对话诱导下全部“沦陷”，均可配合生成虚假学术论文。

最危险的是，这种缺陷正被“精准利用”。AI能生成完整的虚假论文信息——标题、作者、期刊、卷期页码，甚至DOI编号。还能编造符合统计规律的“实验数据”，附带p值、置信区间等专业指标，通过传统数据校验。生成的论文结构严谨、语言流畅，精准匹配学术范式，使同行评审难以识别。

“幽灵文献”一旦混入学术体系，将成为后续研究的“污染源”，形成错误引用链，破坏科学知识的积累与传承。

学术圈震动：顶会用行动说“不”

面对污染，学术圈已开始行动。

2025年11月，ICLR（国际表征学习大会）的评审平台OpenReview出现严重漏洞，导致近万篇论文的作者及审稿人相关数据被窃取并在网络广泛传播，成为同行评议数据泄露事件中规模最大的案例之一。

2026年3月，ICML（国际机器学习大会）震惊学界——一次性“桌拒”497篇论文，占总投稿量的2%。原因是这些论文的作者在对其他论文进行同行评审时违反了AI使用政策。大会在提交的PDF论文中隐藏了“水印”，通过水印诱导AI在生成的审稿意见中留下特定标记，精准识别出违规行为。这释放了一个明确信号：学术共同体正以强硬姿态捍卫评审的严肃性。

如何保护学术文献不被“污染”？

面对这场系统性危机，各方正在构建防御体系。

技术上，德国柏林自由大学的研究者编写脚本对Crossref数据库中的引文交叉比对，已筛出500余篇存疑文献。法国国家科研中心团队推出免费工具bibCheck，精准比对引文是否指向真实文献。前沿出版集团已开发内部AI筛查工具，用于稿件初审阶段标记“幻觉引文”。

制度上，期刊正强化AI使用规范。国内18家大模型厂商联合发布AI全链条自律标准，部分期刊已要求作者提交数据溯源证明和AI使用声明。卡巴纳克明确指出，含有“幻觉引文”的论文绝不应出现在学术殿堂，一经发现，出版方应立即发布声明，并视情况启动更正或撤稿程序。

写在最后：你我该如何应对？

对科研人员来说，面对这场正在蔓延的污染，需要建立三道防线：

第一道防线是自查。使用AI辅助写作后，必须逐条核对参考文献——确认每一篇文献在数据库中真实可查。即便AI生成的内容“看起来很专业”，也不能代替人工验证。

第二道防线是工具辅助。利用bibCheck、Check If Exist等开源工具自动筛查可疑引文。技术可以成为应对技术污染的有力武器。

第三道防线是共同体监督。发现“幽灵文献”后，通过PubPeer等学术评议平台公示存疑文献，让学术共同体共同维护文献纯净。

正如《科学》杂志评论所言：“当AI能完美模仿科学研究的外在形式，我们更需坚守科学精神的内核——求真。”AI幻觉污染的警钟已经敲响，守护科学文献的纯净，需要每一位科研人行动起来。

以上内容均来自于网络，如有侵权后台联系我们进行删除

扫码添加微信，即可获得：

①个性化刊物推荐：深度分析您的研究，推荐3-5本高契合度sci期刊。

②内部动态早知道：优先获取新收录期刊、审稿政策变化、特刊征稿等信息。

③一对一答疑解惑：针对您的具体论文和发表目标，提供针对性建议。

为公众号读者特别开放【免费】咨询服务！仅限前10位哦，先到先得！