



近日,学术出版行业媒体Research Information刊发题为《The fake citation landscape: examples from the wild》的分析文章,围绕当前不断增加的“虚假引文(hallucinated citations)”现象进行了讨论,并列举了多个已经出现在正式出版文献中的真实案例。文章作者为Oxford PharmaGenesis高级技术编辑Nick Morley。
所谓“虚假引文”或“幻觉引文”,是指由AI生成、但实际上并不存在或存在明显错误的参考文献。这类问题近年来随着生成式AI工具在科研写作中的广泛使用而迅速受到关注。
虚假引文并非单一问题,而是一个从“轻微不一致”到“完全捏造”的连续谱(continuum)。有些参考文献可能只是DOI、页码或作者信息出现错误;而另一些则完全不存在于任何学术数据库之中。
文章首先列举了一类被称为“幽灵来源(phantom sources)”的案例,即引用的论文根本不存在。例如,一篇已经发表的研究论文中曾引用题为《Momentum-space topology in materials》的文章,并标注发表于《Nature Communications》2021年第12卷,但作者指出,这篇文献实际上并不存在。
除了完全不存在的文献之外,文章还提到另一类更难发现的问题,即“拼接型引文(hybrid citations)”。这类参考文献往往混合了真实与虚假的信息。例如,标题可能来自一篇真实论文,但作者、年份、期刊或DOI则被错误组合。由于其中部分信息是真实的,因此这类错误比完全虚构的文献更难被编辑与审稿人识别。这种现象的危险性在于,其表面形式“看起来像真的”。特别是在当前学术论文数量持续增加、编辑部工作压力加大的背景下,参考文献核查往往难以做到逐条验证。
虚假引文问题目前已经不仅仅停留在个别案例层面。越来越多研究开始尝试量化这一现象。近期一项发表于《The Lancet》的研究,对PubMed Central开放获取数据库中约250万篇论文、9710万条参考文献进行了自动化审计,最终识别出超过4000条“伪造引文(fabricated references)”,涉及2810篇论文。
根据Retraction Watch引用的研究数据,在被识别出存在虚假参考文献的论文中,超过98%尚未看到出版机构采取正式处理措施。传统同行评议体系主要关注研究结果、方法与学术价值,而参考文献真实性长期被视为“默认可信”的部分。但在AI时代,这种默认前提正在被打破。
当前很多虚假引文并不一定意味着作者存在主观恶意。部分研究者可能只是直接复制了AI生成内容,而没有逐条验证参考文献真实性。但无论原因如何,最终责任仍然由作者承担。在实际出版流程中,编辑与出版商也正在开始建立新的核查机制。一些出版机构已经尝试使用自动化工具检查参考文献真实性,包括DOI验证、Crossref匹配与数据库比对等。
不过,目前这些工具仍存在不少局限。例如,由于参考文献格式不统一、部分文献数据库覆盖不足,以及非英语出版物信息不完整,自动检测系统仍然容易出现误报(false positives)问题。为了从源头规避虚假文献引用风险,我们退出参考文献真实性检测服务:
AiScholar 参考文献真实性检测

点击:https://ais.cn/u/Efmaey(文末阅读原文)
首次免费,欢迎体验
安全可靠:数据仅用于检测,不收录、不留痕
便捷快速:操作极简,24H自助,多条批量,秒级处理
轻量化高效:无需安装,在线即用,文本输入,即出报告
3步完成检测
输入文献列表
点击进入:https://ais.cn/u/Efmaey
将需要检测的“论文名称”“参考文献内容”输入后提交订单。

提交订单并完成支付
系统确认检测内容后进入处理流程,自动开展文献真实性核验。
查看/下载检测报告
检测完成后,可在线查看报告详情,也可下载报告用于投稿前自查。

首次免费体验
AiScholar 参考文献真实性检测

AiScholar 参考文献真实性检测
让每一条引用更真实,让每一份成果更可信
夜雨聆风