AI备好了工具,但没人敢做“耿同学”

“抖音永久限流，商单权限永久封禁。”

5月29日，耿同学在B站动态里发布了一段文字，其中一句格外沉重：“如果后面彻底没了，请记得俺不是孬种。”

而就在一个多月前，他还只是一个鲜有人关注的退学博士。

没有高校职务，也没有专业调查团队，耿同学凭借手里的工具是几个AI软件和统计分析脚本，在短短36天时间里，接连实名举报了5位985高校院长级学者，被点名的无一例外都是学术界最显赫的一批人。

举报对象里，不乏有在《Nature》正刊发表过论文的科学家。

然而，因为一些原因，这场由一个退学博士掀起的学术打假风暴，就这样戛然而止。

工具有多简单，造假就有多敷衍

耿同学的打假方式，并未依赖内部爆料，也不靠学术圈的人脉关系。他的起点，是一个普通群友在微信群里转发文章，随口说了一句：“这篇顶刊论文的数据也太离谱了。”

而他使用的检测手段原理并不复杂，真实的实验数据，末位数字应当近似接近随机分布，0到9各出现大约10%。但人为捏造数据时，造假者往往倾向于凑整，大量选用0或5结尾的数字。这套方法算不上前沿技术，真正把它用来批量扫学术论文，需要的不过是一点编程能力和耐心。

另一个手段是图片核查，将论文里的图片丢给视觉大模型比对，一张图哪怕被翻转过、调过亮度、裁掉了边缘，AI也能在不同论文之间识别出相似特征，判断是否存在重复使用。

总结起来，核心流程只有三步。将论文PDF拆成文本、表格和图片，将数据交给AI做异常检验，把图片交给图像识别工具做相似度比对。

他说，这没有任何技术门槛，只要会用电脑，任何人都能做到。

长期以来，学术审查体系普遍依赖人工与同行自律，审稿人记不住所有图片，期刊编辑没有时间做统计检验，同行即便看出问题，也未必愿意开口。这种集体默契，让学术造假长期是一门低风险、高回报的生意。

学术打假，正在变成一件普通人也能做的事

在AI工具大规模普及之前，学术打假几乎是一项高壁垒的活动。要么你要是圈内人，能读懂那些晦涩的学术论文，要么你需像饶毅（著名生物学家，曾公开质疑学术不端）那样，在业界有足够高的地位和资源，还得有扛得住压力的勇气。

而AI改变了这道门槛。

不需要读懂一篇生命科学论文，不需要理解背后的复杂实验机制，只要把图片送进模型，它就能找出哪两张在视觉上高度相似。

如今，各类文本与数据统计检验工具门槛持续走低，过去需要要专业软件、需要圈内资源才能完成的分析，如今写几行脚本就能搭起一套流水线。

前不久，《柳叶刀》发表了哥伦比亚大学一个团队的研究，他们用AI构建了一套自动核查系统，扫描了PubMed Central上近四年发表的250万篇生物医学论文，逐一比对其中9700万条参考文献，最终在近3000篇论文里发现了超4000条根本不存在的假引用。

带有伪造引用的论文数量在短短三年内激增了12倍。

造假密度从2024年中可以明显加速，时间节点恰好与大语言模型写作工具的大规模普及时间高度吻合。AI生成的假引用往往格式规整、主题贴切，足以骗过人工审稿。

耿同学的方法被技术圈广泛拆解和复现之后，很快有人将其标准化，做出了专门的“耿同学”AI打假skill，该skill可以自动标注论文异常内容，从而大幅降低初筛成本。

AI已经可以将学术打假里那些脏活、累活、初筛工作，变成一套可复核的标准化流程。

越粗糙的造假，越难逃AI审查。

AI擅长找异常，还能打什么假？

学术造假只是一个最直观的起点。AI的核心能力是模式识别，在海量数据里找到不该存在的规律，或者找到应该存在却缺失的东西。这套能力，正在被用到越来越多需要核验信息真实性的地方。

医学影像造假是另一个方向。论文里的核磁共振图、病理切片、细胞显微图，同样可以被剪切、拼接、翻转或重复使用，有时只是改变一下对比度或裁掉边缘，就被当成不同实验的独立结果。

在学术界之外，AI打假的触角延伸得更远，逻辑却是相通的。

过去，一段来源不明的视频往往需要记者和核查团队反复比对，才能判断真假。如今，许多核查工作已经有了AI辅助。视频中的面部表情是否自然、光线变化是否符合现场环境、声音与口型是否对应，都能成为判断依据。

2023年加沙冲突期间，大量流传的现场照片里有多张被核查机构追溯到数年前的叙利亚或伊拉克冲突。图片本身是真实的，只是时间和地点全错了。AI图片溯源工具通过比对元数据与反向图像检索，几分钟内就能完成人工需要数小时的核查。

法律上同样如此。一份看起来毫无问题的合同，可能在字体、页码、印章位置等细节上露出破绽。经验丰富的律师或许能够发现这些异常，但面对成百上千份文件时，很难保证不遗漏。AI则擅长从海量文档中寻找那些不合常理的细节，把可疑之处提前筛选出来，再交给专业人员进一步确认。

无论是核查论文数据、审阅法律文件，还是分析企业财报，本质上都在做同一件事，从海量信息中寻找那些违背常态的细微痕迹，而这恰恰是AI最擅长的工作之一。

这不意味着AI能解决所有虚假信息问题。它能做的，是将发现异常这件事的成本压到足够低。

耿同学在一次采访中说了一句话，被很多人反复提及：“这段时间做打假以来，没有任何一篇问题论文，是官方自己去找出来的。这是迄今为止让我感到最失望的一点。”

耿同学之所以广受关注，并不只是因为他发现了多少问题论文，而是因为他愿意把发现的问题公开摆到台面上。

AI时代，我们不缺发现问题的工具，也不缺传播的渠道。缺的是更多能接住这些声音的“耿同学们”，缺的是一个能认真处理的系统。