AI“伪造文献”正渗透顶级期刊,开源工具如何为学术引用筑起“防火墙”?-夜雨聆风

AI“伪造文献”正渗透顶级期刊,开源工具如何为学术引用筑起“防火墙”?

编者注：

随着大模型参与科研写作的比例上升，引用真实性问题逐渐浮现。本文基于最新报道，聚焦AI生成虚假参考文献在同行评议中的渗透现象及技术应对方案。

当新墨西哥大学的斯蒂芬妮·摩尔教授收到一封索要论文的邮件时，她感到了困惑。对方引用的论文标题、期刊名称乃至合著者都准确无误，格式完美，甚至还有一个看似有效的DOI。但问题在于，这篇署着她大名的论文根本不存在。这是2026年初，摩尔教授与同事查尔斯·霍奇斯共同遭遇的“学术幽灵”事件——一条由人工智能生成的、以假乱真的“幻觉引用”。

这并非孤例。从教育学期刊到顶级人工智能会议，一种由AI“幻想”出的虚假参考文献，正在悄然绕过同行评议，侵入学术出版的肌体。对于出版界的编辑、审稿人而言，这不仅是新的诚信挑战，更可能动摇学术论证的根基。与此同时，一项名为CiteAudit的开源工具正试图为这场“猫鼠游戏”提供系统性解决方案。

“完美”的陷阱：AI如何炮制难以察觉的“幽灵文献”

“幻觉引用”之所以危险，在于其高度的欺骗性。大语言模型能够生成格式规范、要素齐全的参考文献条目：一个合理的论文标题、一组在相关领域活跃的作者姓名、一个知名的期刊或会议名称，甚至一个指向404页面的虚假DOI。正如《技术与教师教育杂志》主编安德里亚·哈金斯-布朗所言，这些引用“看起来非常可信”，因为它们被设计的目的就是生成看似合理的内容。

传统的出版流程在面对这种新型威胁时显得脆弱。以往，参考文献列表通常在评审后期或编辑加工阶段才被仔细核查。然而，随着AI辅助写作的普及，投稿中夹杂虚假引用的现象正在增加。哈金斯-布朗主编发现，在她任职约一年时间里，此类问题比上任初期更为常见。更棘手的是，这些“幽灵引用”可能逃过多轮评审，直到最后阶段才被发现，导致本有价值的研究因诚信瑕疵而被拒稿，造成巨大损失。

行业应对之困：从人工筛查到工具局限

面对挑战，出版机构已在行动。例如，Springer出版社等已开始对投稿进行预筛查，试图在稿件到达主编桌前就拦截存在明显诚信问题的投稿。然而，完全依赖人工核查在当下已不现实。近几十年来，学术论文的参考文献数量不断膨胀，使得审稿人和编辑逐条核实每一条引用的可行性大大降低。

现有的自动化引用核查工具也存在明显局限。一方面，许多工具是专有系统，其算法不透明，难以进行独立的评估与比较；另一方面，它们在处理现实世界中千变万化的引用格式时，表现并不稳定，误判率较高。

CiteAudit：用“多智能体”架构实现高效精准打假

在此背景下，一项旨在系统性解决该问题的开源工具CiteAudit引起了业界关注。与依赖单一模型判断不同，CiteAudit采用了一种创新的“多智能体”协同工作流程，将引用验证拆解为多个专业化步骤：

提取：首先从上传的论文PDF中自动提取书目信息。
记忆：比对历史记录，避免重复验证相同引用。
搜索：调用搜索引擎API，获取网络上的相关证据。
评估：将原文引用与搜索结果进行细致的逐字符比对。
学术：在必要时，进一步查询Google Scholar等权威学术数据库，进行终极裁决。

所有这些步骤由一个大型语言模型控制器进行协调，确保仅在必要时启动更复杂、更耗资源的验证环节，从而在效率与准确性之间取得平衡。

数据说话：开源方案为何优于通用大模型？

根据其团队发布的基准测试结果，CiteAudit的表现显著优于直接使用通用商业大模型。

高精度：在对包含真实与伪造引用的测试集上，CiteAudit的总体判断准确率达到了97.2%。它能识别出测试集中全部的伪造引用，同时将真实引用的误判率控制在较低水平。
高效率：系统处理速度较快，平均约2.3秒即可完成10条引用的核查。
超越商业模型：相比之下，像GPT-5.2这样的先进模型虽然也能检测到大部分伪造引用，但在处理已发表论文中的真实案例时，却可能将近一半（约47.8%）的真实引用错误地标记为“伪造”。这种高误报率使其难以直接应用于严谨的出版流程。

CiteAudit目前以免费Web应用的形式提供，允许用户每日检查一定数量的引用。其开源、透明的特性，为期刊编辑部、会议程序委员会提供了一个可审计、可集成的基础设施选项。

启示与未来：重建信任，流程前置

AI生成的“幻觉引用”泛滥，暴露了学术出版流程在面对新型技术风险时的滞后性。它迫使整个行业重新思考：在AI深度参与科研写作的时代，如何重塑确保文献引用真实性的“安全网”？

对于出版界专业人士而言，这意味着：

将引用核查环节“前置”：不能再将参考文献检查视为排版后的最后一步。在送审前或初审阶段进行自动化筛查，可能成为防范风险的新标准操作。

2.拥抱透明、开源的工具：专有工具的黑箱性质可能带来新的不确定性与依赖。像CiteAudit这类开源解决方案，允许社区审查其方法、复现其结果，更符合学术界的开放精神。

3.重申作者责任与编辑警觉：技术工具是辅助，而非替代。最终的责任仍在作者身上，确保每一处引用的真实性。而编辑和审稿人也需提高对这类新型学术不端形式的警觉，特别是在面对那些“看起来过于完美”的参考文献列表时。

AI在提升科研效率的同时，也带来了伪造的低成本与高隐蔽性。对抗“幻觉引用”的斗争，不仅是技术工具的比拼，更是对学术出版流程完整性的一次压力测试。像CiteAudit这样的尝试，其价值不仅在于提供了一个检测工具，更在于为整个行业如何系统性应对AI时代的诚信挑战，提供了一个值得深入探讨的范式。

参考文献：

https://the-decoder.com/hallucinated-references-are-passing-peer-review-at-top-ai-conferences-and-a-new-open-tool-wants-to-fix-that

关于ScienceOpen

ScienceOpen于2013年由Alexander Grossmann 教授和Tibor Tscheke博士创建于德国柏林，现任CEO是Stephanie Dawson博士。ScienceOpen是一个免费访问的搜索和发现平台，它将学术研究置于发现环境中，通过AI过滤，专题合集和来自学者互助，帮助您找到您所在领域内外最相关的文章。

关于ScienceOpen学术期刊推广服务

ScienceOpen将为期刊创建主题合集，将期刊近期的英文摘要（可以中英文对照）展示在ScienceOpen的平台上。ScienceOpen将通过一系列的推广模式扩大期刊的国际影响力，包括但不限于：发布新闻稿、关键词匹配推荐至类似其他期刊页面展示、社交媒体转发期刊内容、不定期组织专辑推荐期刊等。

本文由ScienceOpen苏州办公室翻译整理，

中文内容仅供参考，一切内容以英文原版为准。

欢迎转发本文至朋友圈，公众号转载请联系

haibao.xue@scienceopen.com

更多中国区合作期刊：

·欢迎《工矿自动化》杂志加入ScienceOpen

·欢迎NPT加入ScienceOpen

·欢迎《中华全科医学》杂志加入ScienceOpen

·欢迎JOUC杂志加入ScienceOpen

·欢迎Marine Development加入ScienceOpen