“抖音永久限流,商单权限永久封禁。”

举报对象里,不乏有在《Nature》正刊发表过论文的科学家。
01
耿同学的打假方式,并未依赖内部爆料,也不靠学术圈的人脉关系。他的起点,是一个普通群友在微信群里转发文章,随口说了一句:“这篇顶刊论文的数据也太离谱了。”
而他使用的检测手段原理并不复杂,真实的实验数据,末位数字应当近似接近随机分布,0到9各出现大约10%。但人为捏造数据时,造假者往往倾向于凑整,大量选用0或5结尾的数字。这套方法算不上前沿技术,真正把它用来批量扫学术论文,需要的不过是一点编程能力和耐心。
另一个手段是图片核查,将论文里的图片丢给视觉大模型比对,一张图哪怕被翻转过、调过亮度、裁掉了边缘,AI也能在不同论文之间识别出相似特征,判断是否存在重复使用。
总结起来,核心流程只有三步。将论文PDF拆成文本、表格和图片,将数据交给AI做异常检验,把图片交给图像识别工具做相似度比对。

他说,这没有任何技术门槛,只要会用电脑,任何人都能做到。
长期以来,学术审查体系普遍依赖人工与同行自律,审稿人记不住所有图片,期刊编辑没有时间做统计检验,同行即便看出问题,也未必愿意开口。这种集体默契,让学术造假长期是一门低风险、高回报的生意。
02
在AI工具大规模普及之前,学术打假几乎是一项高壁垒的活动。要么你要是圈内人,能读懂那些晦涩的学术论文,要么你需像饶毅(著名生物学家,曾公开质疑学术不端)那样,在业界有足够高的地位和资源,还得有扛得住压力的勇气。
而AI改变了这道门槛。
不需要读懂一篇生命科学论文,不需要理解背后的复杂实验机制,只要把图片送进模型,它就能找出哪两张在视觉上高度相似。
如今,各类文本与数据统计检验工具门槛持续走低,过去需要要专业软件、需要圈内资源才能完成的分析,如今写几行脚本就能搭起一套流水线。
前不久,《柳叶刀》发表了哥伦比亚大学一个团队的研究,他们用AI构建了一套自动核查系统,扫描了PubMed Central上近四年发表的250万篇生物医学论文,逐一比对其中9700万条参考文献,最终在近3000篇论文里发现了超4000条根本不存在的假引用。

造假密度从2024年中可以明显加速,时间节点恰好与大语言模型写作工具的大规模普及时间高度吻合。AI生成的假引用往往格式规整、主题贴切,足以骗过人工审稿。
耿同学的方法被技术圈广泛拆解和复现之后,很快有人将其标准化,做出了专门的“耿同学”AI打假skill,该skill可以自动标注论文异常内容,从而大幅降低初筛成本。
AI已经可以将学术打假里那些脏活、累活、初筛工作,变成一套可复核的标准化流程。
越粗糙的造假,越难逃AI审查。
03
学术造假只是一个最直观的起点。AI的核心能力是模式识别,在海量数据里找到不该存在的规律,或者找到应该存在却缺失的东西。这套能力,正在被用到越来越多需要核验信息真实性的地方。
医学影像造假是另一个方向。论文里的核磁共振图、病理切片、细胞显微图,同样可以被剪切、拼接、翻转或重复使用,有时只是改变一下对比度或裁掉边缘,就被当成不同实验的独立结果。
在学术界之外,AI打假的触角延伸得更远,逻辑却是相通的。
2023年加沙冲突期间,大量流传的现场照片里有多张被核查机构追溯到数年前的叙利亚或伊拉克冲突。图片本身是真实的,只是时间和地点全错了。AI图片溯源工具通过比对元数据与反向图像检索,几分钟内就能完成人工需要数小时的核查。
这不意味着AI能解决所有虚假信息问题。它能做的,是将发现异常这件事的成本压到足够低。
耿同学在一次采访中说了一句话,被很多人反复提及:“这段时间做打假以来,没有任何一篇问题论文,是官方自己去找出来的。这是迄今为止让我感到最失望的一点。”
AI时代,我们不缺发现问题的工具,也不缺传播的渠道。缺的是更多能接住这些声音的“耿同学们”,缺的是一个能认真处理的系统。
夜雨聆风