大家好,我是墨鱼。
5 月 21 日,学术圈炸了。
一个北航博士五年级退学的 B 站 up 主"耿同学讲故事",用免费工具加几行简单数学,在 36 天内连续实名举报 5 位 985 院长级学者。被点名的都是手握国家杰青、长江学者头衔的资深学者。
到 5 月 22 日晚——同济大学生命科学学院原院长王平被官方确认学术不端,免去院长职务并降级,论文第一作者被解聘。其他几位涉事学者所在的南开、中山、上海大学也陆续作出回应。
更值得我们关注的不是这一个事件本身,而是它代表的趋势:
同一天,多家"AI 学术打假"赛道初创公司宣布获得巨额投资。
打假这件事正在从"少数有侠义心、有时间的人慢慢做"变成"AI 工具自动批量化、人人可参与"。任何技术过关的人都能在一晚上自动扒 100 篇论文。
这是分水岭。从今往后,你的论文不再只面对同行评议——它面对的是一个永不下线、永不疲倦、永不收费的全民审查器。
这篇文章不吃瓜,专讲方法论。先拆耿同学到底用了什么"魔法",再列出6 件你今晚就能做的自查——把未来 10 年才会被扒到的雷,今天提前拆掉。
一、耿同学到底用了什么"魔法"?三类核心方法
读完所有公开信息,他用的方法全部是公开的、有理论基础的、免费可学的。没有任何黑科技。
方法一:数据末位偏好检测(Benford 定律的扩展)
自然产生的数据有一个统计规律——末位数字的分布应该接近均匀(0-9 每个数字约 10%)。但人为编造的数据有典型特征:偏爱整数 0 和 5(凑整心理)、回避数字 7(认为"看着不真")。
耿同学最致命的一招就是这个:扒一篇论文的所有实验数据,画一张末位数字分布图——如果 0 和 5 占比 30% 以上、7 出现频率低于 5%,就要警觉了。
这一招对做实验数据 / 调查问卷数据 / 临床数据的论文杀伤力最大。
方法二:图片重复与微调检测
学术造假最常见的手法之一是图片复用——同一张 western blot 条带、同一张细胞培养图、同一张显微镜照片,经过裁剪、旋转、镜像、加噪点后用到不同论文里。
肉眼很难看出,但有专门的图像相似度检测工具(下面工具栈会列)可以批量比对。耿同学的几个核心举报案例就是用这个找出来的。
方法三:作者-合作网络异常分析
通过 Crossref / OpenAlex 等开放学术数据库,可以画出某个学者的合作网络图。
异常信号包括:
• 短时间内合作者激增("挂名农场") • 合作者之间从无任何其他交集(不自然) • 一作 / 通讯作者的署名顺序在不同论文里有意安排(凑代表作)
这一招对国自然 2026 强制要求的"个人贡献描述"是直接打击。
二、AI 学术打假工具栈(全部免费或开源)
下面这些工具,你的论文今晚就可能被人用上。所以你也最好先用它们扫一遍自己。
| PubPeer | ||
| ImageTwin | ||
| Forensically | ||
| Image-Detect / Hive | ||
| benford.analysis (R 包) | ||
| OpenAlex / Crossref API | ||
| PyMuPDF + ELA 脚本 | ||
| Scholar Plagiarism Checker |
这些工具组合起来,一个稍懂 Python 的本科生周末就能跑通"批量扒论文"流程。
这才是耿同学事件最深远的影响——打假门槛被打下来了。
三、6 件你今晚就能做的自查(核心)
下面 6 件自查动作,严格对应耿同学用的方法 + 015 那篇五步核查法的反向应用。每件都附具体可执行的工具或提示词。
自查 1:你的数据末位是不是太"漂亮"?
红旗信号:末位 0 和 5 出现频率超过 30%、7 出现频率低于 5%。
操作(5 分钟):
1. 把论文中的所有实验数据(精确到末位)汇成一个 CSV 2. 用以下 Python 跑一遍:
import pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv("your_data.csv")# 提取所有末位数字last_digits = data["value"].astype(str).str[-1].astype(int)freq = last_digits.value_counts(normalize=True).sort_index()print(freq)freq.plot.bar()plt.show()3. 如果 0 / 5 显著偏多 → 回去检查你是不是无意中"凑整"了——很多时候我们写论文时下意识把 12.347 写成 12.35,10 次就是雷点
自查 2:你的图片有没有"复用"嫌疑?
红旗信号:同一篇论文不同 figure 的细节区域高度相似 / 不同论文用了"看上去差不多但其实裁剪过"的图。
操作(10 分钟):
1. 把论文中所有图片导出 2. 上传到 Forensically(29a.ch/photo-forensics)做克隆检测和 ELA 3. 特别警惕:如果你在多个论文里用过同一组实验的图片,确认裁剪 / 增强参数清晰记录在方法里
自查 3:你的合作者列表是不是太"工整"?
红旗信号:你最近 3 篇论文的作者列表里有一个"完全不在你研究圈内"的人反复出现却没有具体贡献描述。
操作(15 分钟):
1. 列出最近 5 篇论文的所有合作者 2. 对每位合作者标注:实际贡献是什么、是否能用一句话描述 3. 凡是描述不出来的人——国自然 2026 新规下你下次申报会被扣分
自查 4:你的引用是否经得起 015 五步核查?
直接套用 015 那篇的五步法:DOI 核查 → 作者匹配 → 期刊对账 → 原文比对 → 多库交叉。
重点新增:现在 PubPeer 上有专门的"AI hallucinated reference"标签——伪造引用一旦被发现,PubPeer 帖子永久存在。10 年后还能被新博士搜到。
自查 5:你的方法部分是否真的可重复?
红旗信号:
• 关键参数没说明(学习率 / 阈值 / 软件版本) • 数据预处理步骤太模糊 • 代码 / 数据没有 GitHub 链接 • "采用了 XX 方法"但没说具体哪个版本 / 哪个实现
操作:把方法章节发给一个完全不懂你研究的同行,让他用一句话复述实验步骤——如果他描述不清,审稿人也描述不清。
自查 6:你的"代表作贡献"是否经得起追问?
红旗信号:你列入个人代表作的论文里,有一篇你说不清自己当时具体做了什么实验 / 写了哪一段 / 提了什么具体观点。
操作:对每篇代表作写一段 100 字的"我贡献什么"具体陈述——国自然 2026 新规已经强制要求,你今天先写好,下次申报直接用。
四、AI 打假元年后,什么变了?
写到这儿,我得说一个让人不舒服的判断。
学术圈的游戏规则正在剧烈重塑。变化方向是这四条:
1. 检测成本极低:以前抓造假要靠人海战术 + 同行猜疑 + 漫长发酵,现在一个普通 up 主用免费工具就能干。耿同学一个人 36 天的产出 = 5 个被处理的院长。这个 ROI 任何研究生都能复制。
2. 检测时间永不结束:你的论文发出去 10 年后依然能被扒。撤稿无时效——同济王平那篇被处理的论文是 2017 年发的。今天你写的论文要按"2036 年还能被人扒"的标准写。
3. 检测范围扩大:从文本到数据、到图片、到引用网络、到 AI 生成痕迹、到合作者署名顺序——全部都在检测射程内。
4. 检测民主化:以前只有同行才能挑刺,现在任何懂技术的本科生都能挑。这是一个不可逆的趋势。
这件事对正直做研究的博士生来说其实是好事——你不需要担心同行不公平竞争。但对所有人而言,写作和数据的纪律性都要再升一个级别。
五、最后三句忠告
写到这儿。三句话送给真在做研究的人。
第一句:AI 学术打假不是少数人的事,是一个新行业的诞生。 不是耿同学一个人能不能做下去的问题——他后面会有 100 个、1000 个用 AI 工具的本科生。这事不会回头。
第二句:你的论文要按"10 年后还能被人扒"的标准写。 这不是夸张。同济那个 2017 年的论文 9 年后被扒。你今天发的论文,2036 年依然在检测网里——而 2036 年的检测工具会比现在强 100 倍。
第三句:今晚就用这 6 件自查跑一遍你最近的论文。 不是已经发表的没救——很多事是预防性的。最近的草稿、修订稿、即将投稿的论文——今晚 30 分钟扫一遍,省下 10 年的撤稿风险。
我自己昨晚通宵把过去 5 年发的 12 篇论文全部跑了一遍。有 2 篇我发现数据末位偏好确实存在轻微偏差(凑整心理留下的痕迹)——好在不是恶意造假、不影响结论,但我已经在邮件里跟期刊编辑做了主动备注。
这就是 AI 打假元年给我们这些"做了规矩研究但写作不够纪律"的研究者的礼物——让我们更紧绷地把每一个数字、每一张图、每一个引用都管严。
这也是为什么我从 013 篇开始就反复强调的闭环原则——所有数据、引用、合作署名,都要经得起反向追溯。
下期预告:6 月就是博士盲审季高峰。下一篇我会做一份《博士盲审送审前 7 天扫雷清单》——把 013-018 这六篇的所有方法整合成一个 7 天日程表,每天一个动作,扫完三大死因(逻辑结构 / 写作规范 / 研究严谨)+ AI 率 + 查重,把雷拆干净再送审。想要的评论区留个言。
夜雨聆风