当论文工厂、审稿工厂和 AI 合流,编辑部还能只靠审稿防守吗?

2026 年 5 月，在温哥华举行的第 9 届 World Conference on Research Integrity（WCRI）上，Forensic Scientometrics movement 发布了首份报告《FoSci Report 2026: Understanding, Detecting, and Documenting Manipulation in the Research Ecosystem》。报告 DOI 为 10.6084/m9.figshare.32178456，共 56 页，由来自学术界、出版界和独立研究诚信调查等领域的 17 位 contributors 参与撰写。

读到报告第 1.1 节“Tortured Phrases”时，几个例子很难不让编辑停一下：有人把 breast cancer 改写成 “bosom peril”，把 sulphuric acid 改写成 “sulphuric corrosive”，把 smart grid 改写成 “shrewd matrix”；在计算机科学论文里，artificial intelligence 甚至会被改成 “man-made consciousness (AI)”。这些词组荒诞得近乎滑稽，但报告并没有把它们当笑话处理。FoSci 把它们称为论文工厂产品中常见的“指纹”。

这正是报告给人的第一层冲击。它没有停留在抽象风险，也没有给编辑部再列一张术语表，而是把许多原本散落在不同环节里的异常放到同一张图里：奇怪表述、图片和数据操纵、署名交易、更正记录异常、开放科学被利用、审稿意见模板化、引用操纵、期刊被劫持、AI 生成内容。单独看，它们像是不同类型的问题；连起来看，研究诚信风险已经从单篇问题论文，扩展为操纵链条、网络和线索系统。

这对国内科技期刊编辑部提出了一个更具体的问题。我们不能只问“这篇稿子有没有问题”，还要追问：它是否和其他稿件、作者、审稿账户、引用关系、邮箱域名、开放材料来源发生了连接？

这不是一份普通风险清单

FoSci 报告的目录本身就透露了它的写法。它没有围着“查重、图片、AI 检测”几个工具议题打转，而是按层级展开：第一部分讨论单篇论文和异常，包括 tortured phrases、data manipulation、image manipulation、authorship；第二部分进入更正和来源问题，包括 incorrect corrections、stealth corrections、content authenticity & provenance；第三部分转向组织化不端，包括 paper mills、review mills、citation manipulation & cartels、hijacked journals；第四部分讨论 university rankings、open science exploitation、company & government interference；第五部分收束到 legal threats 和 artificial intelligence。

报告目录页：FoSci Report 2026 将单篇异常、组织化操纵和结构性问题放在同一张研究诚信地图中。

这样的安排对编辑部有提醒价值：稿件端看到的异常，未必真的起源于稿件端。

报告在 Executive Summary 中用 micro、meso、macro 三层解释 forensic scientometrics。micro 层面像 crime scene investigation，盯住单篇论文、作者和具体异常，细致收集证据；meso 层面把视野放大到 journals、institutions 或 actors clusters，观察协调行为和网络模式；macro 层面再往上看结构和激励，追问研究生态如何放大这些行为，或为什么没能及时发现它们。

报告摘要页：micro、meso、macro 三层框架，把问题从单篇论文推向网络与激励结构。

放到编辑部日常里，这三层可以理解为三类追问：

● 这篇稿件里有什么异常？

● 这些异常是否与其他稿件、账户、机构、引用簇相连？

● 我们的流程、指标和平台机制，有没有给这类操纵留下空间？

过去谈研究诚信，编辑部通常从第一问开始：图片有没有重复，统计有没有异常，伦理审批是否真实，参考文献是否合理，作者贡献声明能否对应研究过程。这些当然是期刊把关的基本功。但 FoSci 报告想把读者往后再推一步，推到第二问和第三问。

一篇稿件里的异常，很多时候只是露在水面上的一点。一个通讯作者频繁出现在边缘相关主题中，一个推荐审稿人邮箱反复使用相近域名，一组论文在短时间内互相引用，几篇稿件的语言模板、图片风格、数据结构高度相似。每次都按“个案”处理，看到的自然只是局部；把这些线索摊开，判断会变得很不一样。

坦白讲，不少编辑部并不是没有警觉。真正麻烦的是，线索很难被接起来。稿件退修了，记录停在系统里；审稿人被替换了，原因只留在经办编辑记忆中；一篇稿件被拒了，相关作者、机构、关键词、引用模式没有进入下一次判断。风险就这样一次次擦身而过，直到某个外部调查把它重新拼出来。

细节比框架更能说明问题

报告中有几处细节，放回编辑部场景后，马上就不再只是“国外案例”。

先看 tortured phrases。报告第 1.1 节说，这类表达通常来自“copy-paraphrase-paste”：作者或操作者使用改写软件，把已发表论文改写成看似新的文章。问题不止是语言别扭，它们可能暴露隐藏抄袭和论文工厂生产痕迹。报告提到，Problematic Paper Screener（PPS）会把新发现的 tortured phrases 作为“fingerprints”记录下来，再通过检索发现更多可疑文章。

编辑部可以从这里得到一个很直接的做法：语言异常不要只按“写作质量差”处理。像“bosom peril”这样的错词，单看是笑料；进入台账以后，就是可复用线索。类似的中介化表达、机器改写痕迹、术语错配、缩写与全称不一致，都应当留下可检索记录。

再看论文工厂的商业逻辑。报告第 3.1 节写得很直接：paper mills sell authorship，保证把欺诈性或低价值文章放进期刊；“作者”支付的价格通常取决于期刊 prestige 和 author position；它们还可能出售 citations。更麻烦的是，论文工厂绕过发表门槛的方法很多：模板化文章、假审稿人、腐败编辑，甚至把自己人放进期刊编辑岗位。

报告列出的识别线索也很细：假邮箱域名，例如 tanu.pro；tortured phrases；“feet of clay”，即引用已撤稿论文；模板化签名；作者网络、文本和图片之间不寻常的相似性。它还提醒，要求作者使用合法学术邮箱有助于拦截部分假域名，但也可能误伤没有稳定机构邮箱的研究者。这一点对中文科技期刊很现实：单一规则不能变成机械筛选，更适合作为风险加权项。

Jennifer Byrne 的案例尤其值得编辑部认真看。报告写道，她原本研究某个罕见基因，后来注意到一批相关文章看似规范，却把核苷酸序列写错了，序列并不匹配论文声称研究的基因。她与 Cyril Labbé 合作，对 12,000 篇 human gene papers 做自动检索，发现其中 700 篇存在错误核苷酸序列，提示这些文章可能由模板生成。

论文工厂章节：报告将 paper mills 描述为出售署名、操纵审稿和引用的商业化链条。

这个案例的警示在于，问题论文不一定粗糙到一眼能看出。它可以有完整结构、标准图表、看似合理的实验叙述。真正暴露问题的，可能是领域专家才会注意到的一个序列、一个材料编号、一个模型参数。机器可以帮助筛查，但第一根线往往来自人的专业直觉。关键在后一步：直觉发现以后，不能只停在“这篇不对”，还要继续查同模板、同图片、同作者网络、同引用方式的其他稿件。

review mills 这一节对编辑部更刺耳。报告第 3.2 节把审稿工厂定义为：具有一定资历的审稿人写出 boilerplate reviews，审稿意见泛泛、模板化，并且可以跨不同 peer review reports 追踪。它们常见目的之一，是在审稿意见里夹带 coercive citation requests，为审稿人自己或网络内合作者增加引用。

我们通常把审稿意见看作专家劳动的结果，更多关注审稿是否及时、意见是否详细、结论是否一致。FoSci 报告把另一个问题摆了出来：审稿意见本身也可能成为操纵载体。几份意见如果总是使用相似套话，总是绕开方法问题，却反复要求添加某几位作者或某个期刊的文献，就不能只当作“审稿风格”。它应当进入审稿人诚信记录。

报告第 3.3 节谈 citation manipulation，列出 forced citations、stealth citations、citation doping、citation cartels、citations for sale 等多种形态。报告还明确说，引用操纵的伤害不止影响指标。扭曲的引用会影响招聘、晋升、基金评价，也会污染系统综述和临床指南；当政策制定依赖“看起来被频繁引用”的研究时，错误影响还会进入公共决策。

这能帮助编辑部纠正一个常见误判：异常引用并不是“小圈子刷指标”那么简单。对医学、农业、工程、环境、公共卫生等应用导向期刊来说，引用网络一旦被操纵，后续综述、指南、标准、政策建议都会受到牵连。编辑部检查参考文献时，不能只看格式是否规范，也要看引用是否支撑论断、是否集中导向某个小圈子、是否在退修中被异常添加。

hijacked journals 这一节与中文科技期刊关系也很近。报告第 3.4 节说，劫持期刊会复制合法期刊的标题、ISSN 和其他元数据，建立克隆网站收取 APC。Retraction Watch Hijacked Journal Checker 到 2025 年 12 月已有超过 400 条记录；报告估计每年约有 70—80 种期刊被劫持。有些期刊会被不同团伙反复劫持，目标包括 print-only journals、niche or trade journals，以及使用本地语言出版的期刊，报告中特别举到 Chinese。

这不是中文科技期刊的外围问题。很多中文期刊仍有纸刊传统，部分英文信息、域名信息、数据库入口、投稿系统入口分散在不同平台。如果作者和读者只能靠标题、ISSN 和搜索引擎结果判断真假，克隆网站就有了空间。编辑部需要把“期刊身份”也纳入研究诚信治理：官网域名、投稿入口、收费说明、数据库链接、英文刊名和 ISSN 展示，都要保持一致、可验证、可追溯。

再看 AI。报告第 5.2 节没有把 AI 写成单独灾难，而是把它称为其他问题的 enabler。它提到，GPTZero、图片重复检测、tortured phrases 检测都有各自用途，但没有 one-size-fits-all tool 能够稳定、准确地识别 AI-generated content。报告还举了 NeurIPS 2025 的例子：GPTZero 在 2026 年初披露，50 多篇论文包含幻觉引用和虚构作者，包括常见占位名 “John Doe”；即使会议录用率只有 24.5%，并经过多名专家审稿，这些问题仍进入了论文。

AI 章节：报告强调 AI 已经成为多类研究诚信风险的放大器。

因此，编辑部不必把 AI 使用一概视为违规。把 AI 当成“原罪”，只会让判断变粗。更需要警惕的是，AI 降低了有组织操纵的成本：生成一批相似摘要、改写论文工厂模板、编造参考文献、制造审稿意见、润色虚假数据叙述，都比过去更便宜。单篇稿件看起来更像“正常论文”，背后的批量操作反而更容易铺开。

这些细节为什么对编辑部有用

FoSci 报告有一条很实用的底层思路：不要只追求一次性判断，要让线索能够被记录、比较和复用。

例如，tortured phrases 对应的是“文本异常线索”；假邮箱域名对应的是“身份与通讯链路线索”；Jennifer Byrne 案例对应的是“领域知识发现的可扩展模板线索”；review mills 对应的是“审稿意见文本相似和强制引用线索”；citation cartels 对应的是“引用网络线索”；hijacked journals 对应的是“期刊身份和元数据线索”；AI 对应的是“内容来源、参考文献真实性和人工监督线索”。

回到编辑部流程里，会发现许多工作不一定要等高成本平台建好以后才启动。编辑部最缺的，常常并非某个神奇检测工具，而是一套能沉淀线索的办法。

审稿制度当然仍然重要。它的优势，是让专业共同体参与判断。它的短板也清楚：审稿人主要面对稿件成品，能看到的数据、流程、作者关系和投稿历史有限。普通质量问题，审稿往往足够有用；碰到组织化操纵，审稿常常只能处理末端结果。

撤稿也是如此。撤稿能够纠正文献记录，但它发生在论文发表之后，往往还需要较长调查周期。等到撤稿公告出现，问题论文可能已经被引用、被纳入综述、被用于评价材料，甚至继续为某些团伙制造“学术产出”的外观。对中文科技期刊而言，撤稿还会牵涉作者沟通、主管单位反馈、数据库更新、舆情压力，成本并不低。

如果编辑部把防守线只设在“审稿发现”和“发表后撤稿”两端，中间会留下很大空隙。投稿前的身份与来源核验，投稿中的模式识别，审稿过程中的异常记录，发表后的引用和更正追踪，都需要进入同一套可追溯记录。

在笔者看来，FoSci 报告的价值就在这里。它没有把研究诚信简化成“买一个检测工具”。它逼着我们回到研究活动和出版流程本身，看问题在哪里出现，又怎样一路传导到期刊端。

从一张线索台账开始

这件事可以从很小的动作做起。

编辑部可以先建立一张内部线索台账，不必一开始就复杂。字段可以围绕六类信息设计。

一是稿件文本异常。记录不合领域常识的术语、疑似机器改写表达、缩写与全称不匹配、参考文献题名与正文论断不匹配、过度模板化段落。这里不急着给作者贴标签，只记录可复查的原句和位置。

二是身份与联系信息。记录异常邮箱域名、推荐审稿人邮箱与作者邮箱的相似性、机构名称不规范、ORCID 或作者主页无法对应、通讯作者变更频繁等。对没有机构邮箱的研究者要保留解释空间，但同一域名、同一电话、同一推荐审稿人组合反复出现，就应当进入风险判断。

三是审稿意见。记录过度泛泛的审稿意见、相似度很高的审稿报告、反复出现的推荐引用、总是回避方法细节却快速给出接收建议的审稿行为。必要时，可以在内部给审稿人账户加注释，而不是只在单篇稿件流程里结束。

四是引用簇。记录退修后突然增加的大量引用、集中指向某个作者群或期刊的引用、与主题关系弱但反复出现的文献、引用已撤稿论文或问题论文的情况。编辑部不必马上做复杂网络分析，先把异常引用保留下来，后续才有比较基础。

五是开放材料来源。记录数据、代码、预注册、伦理审批、图片原始文件、补充材料的来源和版本。FoSci 报告在 paper mills 章节建议，将预注册、开放同行评议、开放数据、开放代码、可识别编辑变成常态；报告也承认，这些做法不能完全排除论文工厂，但会让它们更难操作。这句话很适合编辑部采用：开放不是装饰，开放材料要能被核验。

六是期刊身份。记录本刊官网域名、投稿入口、数据库链接、收费声明、英文刊名、ISSN、主管主办单位信息是否在各平台一致。对收到的作者咨询、疑似克隆网页、假冒录用通知，也要留存截图和链接。劫持期刊并不离中文期刊很远。

这张台账的价值，并非一次就抓住所有问题，核心是改变编辑部的判断单位。下一次类似稿件进入系统时，编辑看到的就不再只是“一篇新稿”，还包括它与既往线索之间的关系。

对人员规模有限的编辑部，这种低成本做法，比追求一步到位的智能平台更现实。成熟以后，期刊集群、学会、出版单位还可以在合规前提下共享风险类型、案例结构和处理规范。单刊发现的是点，平台连接起来才可能看到线。

结尾：把“感觉不对”变成证据

Publishing Perspectives 报道称，FoSci 是一个数据驱动的 movement，目标是检测、分析、揭示 research integrity issues，以改善对研究的信任。报道中 Leslie McIntosh 的判断也很直白：这份报告是在汇集集体知识，提供一张“我们在哪里、知道什么、还需要建设什么”的地图；科学诚信取决于是否愿意行动，而不只是记录。

对编辑部来说，这句话可以落到更具体的层面：可疑稿件处理掉以后，处理过程本身也要留下可复盘、可累积、可连接的线索。

明天再遇到一篇让人不踏实的稿件，编辑部未必马上能判断它背后是否有论文工厂、审稿工厂、引用团伙或 AI 批量生产。但至少可以多做一步：把异常写清楚，把关联记下来，把相似线索放到同一个地方。

研究诚信治理很少起步于宏大方案。更多时候，它开始于编辑部愿意把一次“感觉不对”的处理，变成下一次判断可以调用的证据。

参考来源

1. McIntosh, Leslie D., et al. (2026). Forensic Scientometrics Report. DOI: 10.6084/m9.figshare.32178456

2. Publishing Perspectives: FoSci Releases Report Analyzing Growing Threats to Research Integrity. https://publishingperspectives.com/2026/05/fosci-releases-report-analyzing-growing-threats-to-research-integrity/