AI生成错误引文正进入正式出版物

随着生成式AI越来越多地进入科研写作流程，“虚假引文（fake citations）”问题正在成为国际学术出版界关注的新风险。近期，Research Information刊文梳理了多个已经进入正式出版物的真实案例，反映出AI生成错误参考文献的问题，正在对科研质量控制与出版信誉带来新的挑战。

近日，学术出版行业媒体Research Information刊发题为《The fake citation landscape: examples from the wild》的分析文章，围绕当前不断增加的“虚假引文（hallucinated citations）”现象进行了讨论，并列举了多个已经出现在正式出版文献中的真实案例。文章作者为Oxford PharmaGenesis高级技术编辑Nick Morley。

所谓“虚假引文”或“幻觉引文”，是指由AI生成、但实际上并不存在或存在明显错误的参考文献。这类问题近年来随着生成式AI工具在科研写作中的广泛使用而迅速受到关注。

虚假引文并非单一问题，而是一个从“轻微不一致”到“完全捏造”的连续谱（continuum）。有些参考文献可能只是DOI、页码或作者信息出现错误；而另一些则完全不存在于任何学术数据库之中。

文章首先列举了一类被称为“幽灵来源（phantom sources）”的案例，即引用的论文根本不存在。例如，一篇已经发表的研究论文中曾引用题为《Momentum-space topology in materials》的文章，并标注发表于《Nature Communications》2021年第12卷，但作者指出，这篇文献实际上并不存在。

除了完全不存在的文献之外，文章还提到另一类更难发现的问题，即“拼接型引文（hybrid citations）”。这类参考文献往往混合了真实与虚假的信息。例如，标题可能来自一篇真实论文，但作者、年份、期刊或DOI则被错误组合。由于其中部分信息是真实的，因此这类错误比完全虚构的文献更难被编辑与审稿人识别。这种现象的危险性在于，其表面形式“看起来像真的”。特别是在当前学术论文数量持续增加、编辑部工作压力加大的背景下，参考文献核查往往难以做到逐条验证。

虚假引文问题目前已经不仅仅停留在个别案例层面。越来越多研究开始尝试量化这一现象。近期一项发表于《The Lancet》的研究，对PubMed Central开放获取数据库中约250万篇论文、9710万条参考文献进行了自动化审计，最终识别出超过4000条“伪造引文（fabricated references）”，涉及2810篇论文。

根据Retraction Watch引用的研究数据，在被识别出存在虚假参考文献的论文中，超过98%尚未看到出版机构采取正式处理措施。传统同行评议体系主要关注研究结果、方法与学术价值，而参考文献真实性长期被视为“默认可信”的部分。但在AI时代，这种默认前提正在被打破。

当前很多虚假引文并不一定意味着作者存在主观恶意。部分研究者可能只是直接复制了AI生成内容，而没有逐条验证参考文献真实性。但无论原因如何，最终责任仍然由作者承担。在实际出版流程中，编辑与出版商也正在开始建立新的核查机制。一些出版机构已经尝试使用自动化工具检查参考文献真实性，包括DOI验证、Crossref匹配与数据库比对等。

不过，目前这些工具仍存在不少局限。例如，由于参考文献格式不统一、部分文献数据库覆盖不足，以及非英语出版物信息不完整，自动检测系统仍然容易出现误报（false positives）问题。为了从源头规避虚假文献引用风险，我们退出参考文献真实性检测服务：

AiScholar 参考文献真实性检测

点击：https://ais.cn/u/Efmaey（文末阅读原文）

首次免费，欢迎体验

安全可靠：数据仅用于检测，不收录、不留痕

便捷快速：操作极简，24H自助，多条批量，秒级处理

轻量化高效：无需安装，在线即用，文本输入，即出报告

3步完成检测

输入文献列表

点击进入：https://ais.cn/u/Efmaey

将需要检测的“论文名称”“参考文献内容”输入后提交订单。

提交订单并完成支付

系统确认检测内容后进入处理流程，自动开展文献真实性核验。

查看/下载检测报告

检测完成后，可在线查看报告详情，也可下载报告用于投稿前自查。

首次免费体验

AiScholar 参考文献真实性检测

让每一条引用更真实，让每一份成果更可信