AI“伪造文献”正渗透顶级期刊,开源工具如何为学术引用筑起“防火墙”?

编者注:
随着大模型参与科研写作的比例上升,引用真实性问题逐渐浮现。本文基于最新报道,聚焦AI生成虚假参考文献在同行评议中的渗透现象及技术应对方案。

当新墨西哥大学的斯蒂芬妮·摩尔教授收到一封索要论文的邮件时,她感到了困惑。对方引用的论文标题、期刊名称乃至合著者都准确无误,格式完美,甚至还有一个看似有效的DOI。但问题在于,这篇署着她大名的论文根本不存在。这是2026年初,摩尔教授与同事查尔斯·霍奇斯共同遭遇的“学术幽灵”事件——一条由人工智能生成的、以假乱真的“幻觉引用”。
这并非孤例。从教育学期刊到顶级人工智能会议,一种由AI“幻想”出的虚假参考文献,正在悄然绕过同行评议,侵入学术出版的肌体。对于出版界的编辑、审稿人而言,这不仅是新的诚信挑战,更可能动摇学术论证的根基。与此同时,一项名为CiteAudit的开源工具正试图为这场“猫鼠游戏”提供系统性解决方案。
“完美”的陷阱:AI如何炮制难以察觉的“幽灵文献”
“幻觉引用”之所以危险,在于其高度的欺骗性。大语言模型能够生成格式规范、要素齐全的参考文献条目:一个合理的论文标题、一组在相关领域活跃的作者姓名、一个知名的期刊或会议名称,甚至一个指向404页面的虚假DOI。正如《技术与教师教育杂志》主编安德里亚·哈金斯-布朗所言,这些引用“看起来非常可信”,因为它们被设计的目的就是生成看似合理的内容。
传统的出版流程在面对这种新型威胁时显得脆弱。以往,参考文献列表通常在评审后期或编辑加工阶段才被仔细核查。然而,随着AI辅助写作的普及,投稿中夹杂虚假引用的现象正在增加。哈金斯-布朗主编发现,在她任职约一年时间里,此类问题比上任初期更为常见。更棘手的是,这些“幽灵引用”可能逃过多轮评审,直到最后阶段才被发现,导致本有价值的研究因诚信瑕疵而被拒稿,造成巨大损失。
行业应对之困:从人工筛查到工具局限
面对挑战,出版机构已在行动。例如,Springer出版社等已开始对投稿进行预筛查,试图在稿件到达主编桌前就拦截存在明显诚信问题的投稿。然而,完全依赖人工核查在当下已不现实。近几十年来,学术论文的参考文献数量不断膨胀,使得审稿人和编辑逐条核实每一条引用的可行性大大降低。
现有的自动化引用核查工具也存在明显局限。一方面,许多工具是专有系统,其算法不透明,难以进行独立的评估与比较;另一方面,它们在处理现实世界中千变万化的引用格式时,表现并不稳定,误判率较高。
CiteAudit:用“多智能体”架构实现高效精准打假
在此背景下,一项旨在系统性解决该问题的开源工具CiteAudit引起了业界关注。与依赖单一模型判断不同,CiteAudit采用了一种创新的“多智能体”协同工作流程,将引用验证拆解为多个专业化步骤:
-
提取:首先从上传的论文PDF中自动提取书目信息。
-
记忆:比对历史记录,避免重复验证相同引用。
-
搜索:调用搜索引擎API,获取网络上的相关证据。
-
评估:将原文引用与搜索结果进行细致的逐字符比对。
-
学术:在必要时,进一步查询Google Scholar等权威学术数据库,进行终极裁决。
所有这些步骤由一个大型语言模型控制器进行协调,确保仅在必要时启动更复杂、更耗资源的验证环节,从而在效率与准确性之间取得平衡。

数据说话:开源方案为何优于通用大模型?
根据其团队发布的基准测试结果,CiteAudit的表现显著优于直接使用通用商业大模型。
-
高精度:在对包含真实与伪造引用的测试集上,CiteAudit的总体判断准确率达到了97.2%。它能识别出测试集中全部的伪造引用,同时将真实引用的误判率控制在较低水平。
-
高效率:系统处理速度较快,平均约2.3秒即可完成10条引用的核查。
-
超越商业模型:相比之下,像GPT-5.2这样的先进模型虽然也能检测到大部分伪造引用,但在处理已发表论文中的真实案例时,却可能将近一半(约47.8%)的真实引用错误地标记为“伪造”。这种高误报率使其难以直接应用于严谨的出版流程。
CiteAudit目前以免费Web应用的形式提供,允许用户每日检查一定数量的引用。其开源、透明的特性,为期刊编辑部、会议程序委员会提供了一个可审计、可集成的基础设施选项。
启示与未来:重建信任,流程前置
AI生成的“幻觉引用”泛滥,暴露了学术出版流程在面对新型技术风险时的滞后性。它迫使整个行业重新思考:在AI深度参与科研写作的时代,如何重塑确保文献引用真实性的“安全网”?
对于出版界专业人士而言,这意味着:
-
将引用核查环节“前置”:不能再将参考文献检查视为排版后的最后一步。在送审前或初审阶段进行自动化筛查,可能成为防范风险的新标准操作。
2.拥抱透明、开源的工具:专有工具的黑箱性质可能带来新的不确定性与依赖。像CiteAudit这类开源解决方案,允许社区审查其方法、复现其结果,更符合学术界的开放精神。
3.重申作者责任与编辑警觉:技术工具是辅助,而非替代。最终的责任仍在作者身上,确保每一处引用的真实性。而编辑和审稿人也需提高对这类新型学术不端形式的警觉,特别是在面对那些“看起来过于完美”的参考文献列表时。
AI在提升科研效率的同时,也带来了伪造的低成本与高隐蔽性。对抗“幻觉引用”的斗争,不仅是技术工具的比拼,更是对学术出版流程完整性的一次压力测试。像CiteAudit这样的尝试,其价值不仅在于提供了一个检测工具,更在于为整个行业如何系统性应对AI时代的诚信挑战,提供了一个值得深入探讨的范式。
参考文献:
https://the-decoder.com/hallucinated-references-are-passing-peer-review-at-top-ai-conferences-and-a-new-open-tool-wants-to-fix-that
关于ScienceOpen
ScienceOpen于2013年由Alexander Grossmann 教授和Tibor Tscheke博士创建于德国柏林,现任CEO是Stephanie Dawson博士。ScienceOpen是一个免费访问的搜索和发现平台,它将学术研究置于发现环境中,通过AI过滤,专题合集和来自学者互助,帮助您找到您所在领域内外最相关的文章。
关于ScienceOpen学术期刊推广服务
ScienceOpen将为期刊创建主题合集,将期刊近期的英文摘要(可以中英文对照)展示在ScienceOpen的平台上。ScienceOpen将通过一系列的推广模式扩大期刊的国际影响力,包括但不限于:发布新闻稿、关键词匹配推荐至类似其他期刊页面展示、社交媒体转发期刊内容、不定期组织专辑推荐期刊等。
更多中国区合作期刊:
·欢迎Marine Development加入ScienceOpen
·欢迎Cancer Biology & Medicine 加入ScienceOpen
·欢迎Intelligent Marine Technology and Systems加入ScienceOpen
夜雨聆风