AI 学术打假元年来了:免费工具 36 天扒 5 个院长,普通博士的 6 件自查清单

大家好，我是墨鱼。

5 月 21 日，学术圈炸了。

一个北航博士五年级退学的 B 站 up 主"耿同学讲故事"，用免费工具加几行简单数学，在 36 天内连续实名举报 5 位 985 院长级学者。被点名的都是手握国家杰青、长江学者头衔的资深学者。

到 5 月 22 日晚——同济大学生命科学学院原院长王平被官方确认学术不端，免去院长职务并降级，论文第一作者被解聘。其他几位涉事学者所在的南开、中山、上海大学也陆续作出回应。

更值得我们关注的不是这一个事件本身，而是它代表的趋势：

同一天，多家"AI 学术打假"赛道初创公司宣布获得巨额投资。

打假这件事正在从"少数有侠义心、有时间的人慢慢做"变成"AI 工具自动批量化、人人可参与"。任何技术过关的人都能在一晚上自动扒 100 篇论文。

这是分水岭。从今往后，你的论文不再只面对同行评议——它面对的是一个永不下线、永不疲倦、永不收费的全民审查器。

这篇文章不吃瓜，专讲方法论。先拆耿同学到底用了什么"魔法"，再列出6 件你今晚就能做的自查——把未来 10 年才会被扒到的雷，今天提前拆掉。

一、耿同学到底用了什么"魔法"？三类核心方法

读完所有公开信息，他用的方法全部是公开的、有理论基础的、免费可学的。没有任何黑科技。

方法一：数据末位偏好检测（Benford 定律的扩展）

自然产生的数据有一个统计规律——末位数字的分布应该接近均匀（0-9 每个数字约 10%）。但人为编造的数据有典型特征：偏爱整数 0 和 5（凑整心理）、回避数字 7（认为"看着不真"）。

耿同学最致命的一招就是这个：扒一篇论文的所有实验数据，画一张末位数字分布图——如果 0 和 5 占比 30% 以上、7 出现频率低于 5%，就要警觉了。

这一招对做实验数据 / 调查问卷数据 / 临床数据的论文杀伤力最大。

方法二：图片重复与微调检测

学术造假最常见的手法之一是图片复用——同一张 western blot 条带、同一张细胞培养图、同一张显微镜照片，经过裁剪、旋转、镜像、加噪点后用到不同论文里。

肉眼很难看出，但有专门的图像相似度检测工具（下面工具栈会列）可以批量比对。耿同学的几个核心举报案例就是用这个找出来的。

方法三：作者-合作网络异常分析

通过 Crossref / OpenAlex 等开放学术数据库，可以画出某个学者的合作网络图。

异常信号包括：

• 短时间内合作者激增（"挂名农场"）
• 合作者之间从无任何其他交集（不自然）
• 一作 / 通讯作者的署名顺序在不同论文里有意安排（凑代表作）

这一招对国自然 2026 强制要求的"个人贡献描述"是直接打击。

二、AI 学术打假工具栈（全部免费或开源）

下面这些工具，你的论文今晚就可能被人用上。所以你也最好先用它们扫一遍自己。

工具	用途	链接 / 关键词
PubPeer	全球最大的学术不端讨论平台，任何人都可匿名发帖	pubpeer.com
ImageTwin	AI 图像重复 / 微调检测	imagetwin.ai
Forensically	浏览器端图片篡改检测（ELA、噪声分析、克隆检测）	29a.ch/photo-forensics
Image-Detect / Hive	AI 生成图片检测	aiornot.com / hive.ai
benford.analysis (R 包)	Benford 定律自动检验	CRAN
OpenAlex / Crossref API	合作网络、引用网络分析	openalex.org
PyMuPDF + ELA 脚本	PDF 内图表的篡改痕迹检测	GitHub 开源脚本
Scholar Plagiarism Checker	跨语言文本相似度（防中英文洗稿）	多家提供

这些工具组合起来，一个稍懂 Python 的本科生周末就能跑通"批量扒论文"流程。

这才是耿同学事件最深远的影响——打假门槛被打下来了。

三、6 件你今晚就能做的自查（核心）

下面 6 件自查动作，严格对应耿同学用的方法 + 015 那篇五步核查法的反向应用。每件都附具体可执行的工具或提示词。

自查 1：你的数据末位是不是太"漂亮"？

红旗信号：末位 0 和 5 出现频率超过 30%、7 出现频率低于 5%。

操作（5 分钟）：

1. 把论文中的所有实验数据（精确到末位）汇成一个 CSV
2. 用以下 Python 跑一遍：

import pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv("your_data.csv")# 提取所有末位数字last_digits = data["value"].astype(str).str[-1].astype(int)freq = last_digits.value_counts(normalize=True).sort_index()print(freq)freq.plot.bar()plt.show()

3. 如果 0 / 5 显著偏多 → 回去检查你是不是无意中"凑整"了——很多时候我们写论文时下意识把 12.347 写成 12.35，10 次就是雷点

自查 2：你的图片有没有"复用"嫌疑？

红旗信号：同一篇论文不同 figure 的细节区域高度相似 / 不同论文用了"看上去差不多但其实裁剪过"的图。

操作（10 分钟）：

1. 把论文中所有图片导出
2. 上传到 Forensically（29a.ch/photo-forensics）做克隆检测和 ELA
3. 特别警惕：如果你在多个论文里用过同一组实验的图片，确认裁剪 / 增强参数清晰记录在方法里

自查 3：你的合作者列表是不是太"工整"？

红旗信号：你最近 3 篇论文的作者列表里有一个"完全不在你研究圈内"的人反复出现却没有具体贡献描述。

操作（15 分钟）：

1. 列出最近 5 篇论文的所有合作者
2. 对每位合作者标注：实际贡献是什么、是否能用一句话描述
3. 凡是描述不出来的人——国自然 2026 新规下你下次申报会被扣分

自查 4：你的引用是否经得起 015 五步核查？

直接套用 015 那篇的五步法：DOI 核查 → 作者匹配 → 期刊对账 → 原文比对 → 多库交叉。

重点新增：现在 PubPeer 上有专门的"AI hallucinated reference"标签——伪造引用一旦被发现，PubPeer 帖子永久存在。10 年后还能被新博士搜到。

自查 5：你的方法部分是否真的可重复？

红旗信号：

• 关键参数没说明（学习率 / 阈值 / 软件版本）
• 数据预处理步骤太模糊
• 代码 / 数据没有 GitHub 链接
• "采用了 XX 方法"但没说具体哪个版本 / 哪个实现

操作：把方法章节发给一个完全不懂你研究的同行，让他用一句话复述实验步骤——如果他描述不清，审稿人也描述不清。

自查 6：你的"代表作贡献"是否经得起追问？

红旗信号：你列入个人代表作的论文里，有一篇你说不清自己当时具体做了什么实验 / 写了哪一段 / 提了什么具体观点。

操作：对每篇代表作写一段 100 字的"我贡献什么"具体陈述——国自然 2026 新规已经强制要求，你今天先写好，下次申报直接用。

四、AI 打假元年后，什么变了？

写到这儿，我得说一个让人不舒服的判断。

学术圈的游戏规则正在剧烈重塑。变化方向是这四条：

1. 检测成本极低：以前抓造假要靠人海战术 + 同行猜疑 + 漫长发酵，现在一个普通 up 主用免费工具就能干。耿同学一个人 36 天的产出 = 5 个被处理的院长。这个 ROI 任何研究生都能复制。

2. 检测时间永不结束：你的论文发出去 10 年后依然能被扒。撤稿无时效——同济王平那篇被处理的论文是 2017 年发的。今天你写的论文要按"2036 年还能被人扒"的标准写。

3. 检测范围扩大：从文本到数据、到图片、到引用网络、到 AI 生成痕迹、到合作者署名顺序——全部都在检测射程内。

4. 检测民主化：以前只有同行才能挑刺，现在任何懂技术的本科生都能挑。这是一个不可逆的趋势。

这件事对正直做研究的博士生来说其实是好事——你不需要担心同行不公平竞争。但对所有人而言，写作和数据的纪律性都要再升一个级别。

五、最后三句忠告

写到这儿。三句话送给真在做研究的人。

第一句：AI 学术打假不是少数人的事，是一个新行业的诞生。 不是耿同学一个人能不能做下去的问题——他后面会有 100 个、1000 个用 AI 工具的本科生。这事不会回头。

第二句：你的论文要按"10 年后还能被人扒"的标准写。 这不是夸张。同济那个 2017 年的论文 9 年后被扒。你今天发的论文，2036 年依然在检测网里——而 2036 年的检测工具会比现在强 100 倍。

第三句：今晚就用这 6 件自查跑一遍你最近的论文。 不是已经发表的没救——很多事是预防性的。最近的草稿、修订稿、即将投稿的论文——今晚 30 分钟扫一遍，省下 10 年的撤稿风险。

我自己昨晚通宵把过去 5 年发的 12 篇论文全部跑了一遍。有 2 篇我发现数据末位偏好确实存在轻微偏差（凑整心理留下的痕迹）——好在不是恶意造假、不影响结论，但我已经在邮件里跟期刊编辑做了主动备注。

这就是 AI 打假元年给我们这些"做了规矩研究但写作不够纪律"的研究者的礼物——让我们更紧绷地把每一个数字、每一张图、每一个引用都管严。

这也是为什么我从 013 篇开始就反复强调的闭环原则——所有数据、引用、合作署名，都要经得起反向追溯。

下期预告：6 月就是博士盲审季高峰。下一篇我会做一份《博士盲审送审前 7 天扫雷清单》——把 013-018 这六篇的所有方法整合成一个 7 天日程表，每天一个动作，扫完三大死因（逻辑结构 / 写作规范 / 研究严谨）+ AI 率 + 查重，把雷拆干净再送审。想要的评论区留个言。