2026 年 5 月,在温哥华举行的第 9 届 World Conference on Research Integrity(WCRI)上,Forensic Scientometrics movement 发布了首份报告《FoSci Report 2026: Understanding, Detecting, and Documenting Manipulation in the Research Ecosystem》。报告 DOI 为 10.6084/m9.figshare.32178456,共 56 页,由来自学术界、出版界和独立研究诚信调查等领域的 17 位 contributors 参与撰写。
读到报告第 1.1 节“Tortured Phrases”时,几个例子很难不让编辑停一下:有人把 breast cancer 改写成 “bosom peril”,把 sulphuric acid 改写成 “sulphuric corrosive”,把 smart grid 改写成 “shrewd matrix”;在计算机科学论文里,artificial intelligence 甚至会被改成 “man-made consciousness (AI)”。这些词组荒诞得近乎滑稽,但报告并没有把它们当笑话处理。FoSci 把它们称为论文工厂产品中常见的“指纹”。
这正是报告给人的第一层冲击。它没有停留在抽象风险,也没有给编辑部再列一张术语表,而是把许多原本散落在不同环节里的异常放到同一张图里:奇怪表述、图片和数据操纵、署名交易、更正记录异常、开放科学被利用、审稿意见模板化、引用操纵、期刊被劫持、AI 生成内容。单独看,它们像是不同类型的问题;连起来看,研究诚信风险已经从单篇问题论文,扩展为操纵链条、网络和线索系统。
这对国内科技期刊编辑部提出了一个更具体的问题。我们不能只问“这篇稿子有没有问题”,还要追问:它是否和其他稿件、作者、审稿账户、引用关系、邮箱域名、开放材料来源发生了连接?
这不是一份普通风险清单
FoSci 报告的目录本身就透露了它的写法。它没有围着“查重、图片、AI 检测”几个工具议题打转,而是按层级展开:第一部分讨论单篇论文和异常,包括 tortured phrases、data manipulation、image manipulation、authorship;第二部分进入更正和来源问题,包括 incorrect corrections、stealth corrections、content authenticity & provenance;第三部分转向组织化不端,包括 paper mills、review mills、citation manipulation & cartels、hijacked journals;第四部分讨论 university rankings、open science exploitation、company & government interference;第五部分收束到 legal threats 和 artificial intelligence。
报告目录页:FoSci Report 2026 将单篇异常、组织化操纵和结构性问题放在同一张研究诚信地图中。
这样的安排对编辑部有提醒价值:稿件端看到的异常,未必真的起源于稿件端。
报告在 Executive Summary 中用 micro、meso、macro 三层解释 forensic scientometrics。micro 层面像 crime scene investigation,盯住单篇论文、作者和具体异常,细致收集证据;meso 层面把视野放大到 journals、institutions 或 actors clusters,观察协调行为和网络模式;macro 层面再往上看结构和激励,追问研究生态如何放大这些行为,或为什么没能及时发现它们。
报告摘要页:micro、meso、macro 三层框架,把问题从单篇论文推向网络与激励结构。
放到编辑部日常里,这三层可以理解为三类追问:
● 这篇稿件里有什么异常?
● 这些异常是否与其他稿件、账户、机构、引用簇相连?
● 我们的流程、指标和平台机制,有没有给这类操纵留下空间?
过去谈研究诚信,编辑部通常从第一问开始:图片有没有重复,统计有没有异常,伦理审批是否真实,参考文献是否合理,作者贡献声明能否对应研究过程。这些当然是期刊把关的基本功。但 FoSci 报告想把读者往后再推一步,推到第二问和第三问。
一篇稿件里的异常,很多时候只是露在水面上的一点。一个通讯作者频繁出现在边缘相关主题中,一个推荐审稿人邮箱反复使用相近域名,一组论文在短时间内互相引用,几篇稿件的语言模板、图片风格、数据结构高度相似。每次都按“个案”处理,看到的自然只是局部;把这些线索摊开,判断会变得很不一样。
坦白讲,不少编辑部并不是没有警觉。真正麻烦的是,线索很难被接起来。稿件退修了,记录停在系统里;审稿人被替换了,原因只留在经办编辑记忆中;一篇稿件被拒了,相关作者、机构、关键词、引用模式没有进入下一次判断。风险就这样一次次擦身而过,直到某个外部调查把它重新拼出来。
细节比框架更能说明问题
报告中有几处细节,放回编辑部场景后,马上就不再只是“国外案例”。
先看 tortured phrases。报告第 1.1 节说,这类表达通常来自“copy-paraphrase-paste”:作者或操作者使用改写软件,把已发表论文改写成看似新的文章。问题不止是语言别扭,它们可能暴露隐藏抄袭和论文工厂生产痕迹。报告提到,Problematic Paper Screener(PPS)会把新发现的 tortured phrases 作为“fingerprints”记录下来,再通过检索发现更多可疑文章。
编辑部可以从这里得到一个很直接的做法:语言异常不要只按“写作质量差”处理。像“bosom peril”这样的错词,单看是笑料;进入台账以后,就是可复用线索。类似的中介化表达、机器改写痕迹、术语错配、缩写与全称不一致,都应当留下可检索记录。
再看论文工厂的商业逻辑。报告第 3.1 节写得很直接:paper mills sell authorship,保证把欺诈性或低价值文章放进期刊;“作者”支付的价格通常取决于期刊 prestige 和 author position;它们还可能出售 citations。更麻烦的是,论文工厂绕过发表门槛的方法很多:模板化文章、假审稿人、腐败编辑,甚至把自己人放进期刊编辑岗位。
报告列出的识别线索也很细:假邮箱域名,例如 tanu.pro;tortured phrases;“feet of clay”,即引用已撤稿论文;模板化签名;作者网络、文本和图片之间不寻常的相似性。它还提醒,要求作者使用合法学术邮箱有助于拦截部分假域名,但也可能误伤没有稳定机构邮箱的研究者。这一点对中文科技期刊很现实:单一规则不能变成机械筛选,更适合作为风险加权项。
Jennifer Byrne 的案例尤其值得编辑部认真看。报告写道,她原本研究某个罕见基因,后来注意到一批相关文章看似规范,却把核苷酸序列写错了,序列并不匹配论文声称研究的基因。她与 Cyril Labbé 合作,对 12,000 篇 human gene papers 做自动检索,发现其中 700 篇存在错误核苷酸序列,提示这些文章可能由模板生成。
论文工厂章节:报告将 paper mills 描述为出售署名、操纵审稿和引用的商业化链条。
这个案例的警示在于,问题论文不一定粗糙到一眼能看出。它可以有完整结构、标准图表、看似合理的实验叙述。真正暴露问题的,可能是领域专家才会注意到的一个序列、一个材料编号、一个模型参数。机器可以帮助筛查,但第一根线往往来自人的专业直觉。关键在后一步:直觉发现以后,不能只停在“这篇不对”,还要继续查同模板、同图片、同作者网络、同引用方式的其他稿件。
review mills 这一节对编辑部更刺耳。报告第 3.2 节把审稿工厂定义为:具有一定资历的审稿人写出 boilerplate reviews,审稿意见泛泛、模板化,并且可以跨不同 peer review reports 追踪。它们常见目的之一,是在审稿意见里夹带 coercive citation requests,为审稿人自己或网络内合作者增加引用。
我们通常把审稿意见看作专家劳动的结果,更多关注审稿是否及时、意见是否详细、结论是否一致。FoSci 报告把另一个问题摆了出来:审稿意见本身也可能成为操纵载体。几份意见如果总是使用相似套话,总是绕开方法问题,却反复要求添加某几位作者或某个期刊的文献,就不能只当作“审稿风格”。它应当进入审稿人诚信记录。
报告第 3.3 节谈 citation manipulation,列出 forced citations、stealth citations、citation doping、citation cartels、citations for sale 等多种形态。报告还明确说,引用操纵的伤害不止影响指标。扭曲的引用会影响招聘、晋升、基金评价,也会污染系统综述和临床指南;当政策制定依赖“看起来被频繁引用”的研究时,错误影响还会进入公共决策。
这能帮助编辑部纠正一个常见误判:异常引用并不是“小圈子刷指标”那么简单。对医学、农业、工程、环境、公共卫生等应用导向期刊来说,引用网络一旦被操纵,后续综述、指南、标准、政策建议都会受到牵连。编辑部检查参考文献时,不能只看格式是否规范,也要看引用是否支撑论断、是否集中导向某个小圈子、是否在退修中被异常添加。
hijacked journals 这一节与中文科技期刊关系也很近。报告第 3.4 节说,劫持期刊会复制合法期刊的标题、ISSN 和其他元数据,建立克隆网站收取 APC。Retraction Watch Hijacked Journal Checker 到 2025 年 12 月已有超过 400 条记录;报告估计每年约有 70—80 种期刊被劫持。有些期刊会被不同团伙反复劫持,目标包括 print-only journals、niche or trade journals,以及使用本地语言出版的期刊,报告中特别举到 Chinese。
这不是中文科技期刊的外围问题。很多中文期刊仍有纸刊传统,部分英文信息、域名信息、数据库入口、投稿系统入口分散在不同平台。如果作者和读者只能靠标题、ISSN 和搜索引擎结果判断真假,克隆网站就有了空间。编辑部需要把“期刊身份”也纳入研究诚信治理:官网域名、投稿入口、收费说明、数据库链接、英文刊名和 ISSN 展示,都要保持一致、可验证、可追溯。
再看 AI。报告第 5.2 节没有把 AI 写成单独灾难,而是把它称为其他问题的 enabler。它提到,GPTZero、图片重复检测、tortured phrases 检测都有各自用途,但没有 one-size-fits-all tool 能够稳定、准确地识别 AI-generated content。报告还举了 NeurIPS 2025 的例子:GPTZero 在 2026 年初披露,50 多篇论文包含幻觉引用和虚构作者,包括常见占位名 “John Doe”;即使会议录用率只有 24.5%,并经过多名专家审稿,这些问题仍进入了论文。
AI 章节:报告强调 AI 已经成为多类研究诚信风险的放大器。
因此,编辑部不必把 AI 使用一概视为违规。把 AI 当成“原罪”,只会让判断变粗。更需要警惕的是,AI 降低了有组织操纵的成本:生成一批相似摘要、改写论文工厂模板、编造参考文献、制造审稿意见、润色虚假数据叙述,都比过去更便宜。单篇稿件看起来更像“正常论文”,背后的批量操作反而更容易铺开。
这些细节为什么对编辑部有用
FoSci 报告有一条很实用的底层思路:不要只追求一次性判断,要让线索能够被记录、比较和复用。
例如,tortured phrases 对应的是“文本异常线索”;假邮箱域名对应的是“身份与通讯链路线索”;Jennifer Byrne 案例对应的是“领域知识发现的可扩展模板线索”;review mills 对应的是“审稿意见文本相似和强制引用线索”;citation cartels 对应的是“引用网络线索”;hijacked journals 对应的是“期刊身份和元数据线索”;AI 对应的是“内容来源、参考文献真实性和人工监督线索”。
回到编辑部流程里,会发现许多工作不一定要等高成本平台建好以后才启动。编辑部最缺的,常常并非某个神奇检测工具,而是一套能沉淀线索的办法。
审稿制度当然仍然重要。它的优势,是让专业共同体参与判断。它的短板也清楚:审稿人主要面对稿件成品,能看到的数据、流程、作者关系和投稿历史有限。普通质量问题,审稿往往足够有用;碰到组织化操纵,审稿常常只能处理末端结果。
撤稿也是如此。撤稿能够纠正文献记录,但它发生在论文发表之后,往往还需要较长调查周期。等到撤稿公告出现,问题论文可能已经被引用、被纳入综述、被用于评价材料,甚至继续为某些团伙制造“学术产出”的外观。对中文科技期刊而言,撤稿还会牵涉作者沟通、主管单位反馈、数据库更新、舆情压力,成本并不低。
如果编辑部把防守线只设在“审稿发现”和“发表后撤稿”两端,中间会留下很大空隙。投稿前的身份与来源核验,投稿中的模式识别,审稿过程中的异常记录,发表后的引用和更正追踪,都需要进入同一套可追溯记录。
在笔者看来,FoSci 报告的价值就在这里。它没有把研究诚信简化成“买一个检测工具”。它逼着我们回到研究活动和出版流程本身,看问题在哪里出现,又怎样一路传导到期刊端。
从一张线索台账开始
这件事可以从很小的动作做起。
编辑部可以先建立一张内部线索台账,不必一开始就复杂。字段可以围绕六类信息设计。
一是稿件文本异常。记录不合领域常识的术语、疑似机器改写表达、缩写与全称不匹配、参考文献题名与正文论断不匹配、过度模板化段落。这里不急着给作者贴标签,只记录可复查的原句和位置。
二是身份与联系信息。记录异常邮箱域名、推荐审稿人邮箱与作者邮箱的相似性、机构名称不规范、ORCID 或作者主页无法对应、通讯作者变更频繁等。对没有机构邮箱的研究者要保留解释空间,但同一域名、同一电话、同一推荐审稿人组合反复出现,就应当进入风险判断。
三是审稿意见。记录过度泛泛的审稿意见、相似度很高的审稿报告、反复出现的推荐引用、总是回避方法细节却快速给出接收建议的审稿行为。必要时,可以在内部给审稿人账户加注释,而不是只在单篇稿件流程里结束。
四是引用簇。记录退修后突然增加的大量引用、集中指向某个作者群或期刊的引用、与主题关系弱但反复出现的文献、引用已撤稿论文或问题论文的情况。编辑部不必马上做复杂网络分析,先把异常引用保留下来,后续才有比较基础。
五是开放材料来源。记录数据、代码、预注册、伦理审批、图片原始文件、补充材料的来源和版本。FoSci 报告在 paper mills 章节建议,将预注册、开放同行评议、开放数据、开放代码、可识别编辑变成常态;报告也承认,这些做法不能完全排除论文工厂,但会让它们更难操作。这句话很适合编辑部采用:开放不是装饰,开放材料要能被核验。
六是期刊身份。记录本刊官网域名、投稿入口、数据库链接、收费声明、英文刊名、ISSN、主管主办单位信息是否在各平台一致。对收到的作者咨询、疑似克隆网页、假冒录用通知,也要留存截图和链接。劫持期刊并不离中文期刊很远。
这张台账的价值,并非一次就抓住所有问题,核心是改变编辑部的判断单位。下一次类似稿件进入系统时,编辑看到的就不再只是“一篇新稿”,还包括它与既往线索之间的关系。
对人员规模有限的编辑部,这种低成本做法,比追求一步到位的智能平台更现实。成熟以后,期刊集群、学会、出版单位还可以在合规前提下共享风险类型、案例结构和处理规范。单刊发现的是点,平台连接起来才可能看到线。
结尾:把“感觉不对”变成证据
Publishing Perspectives 报道称,FoSci 是一个数据驱动的 movement,目标是检测、分析、揭示 research integrity issues,以改善对研究的信任。报道中 Leslie McIntosh 的判断也很直白:这份报告是在汇集集体知识,提供一张“我们在哪里、知道什么、还需要建设什么”的地图;科学诚信取决于是否愿意行动,而不只是记录。
对编辑部来说,这句话可以落到更具体的层面:可疑稿件处理掉以后,处理过程本身也要留下可复盘、可累积、可连接的线索。
明天再遇到一篇让人不踏实的稿件,编辑部未必马上能判断它背后是否有论文工厂、审稿工厂、引用团伙或 AI 批量生产。但至少可以多做一步:把异常写清楚,把关联记下来,把相似线索放到同一个地方。
研究诚信治理很少起步于宏大方案。更多时候,它开始于编辑部愿意把一次“感觉不对”的处理,变成下一次判断可以调用的证据。
参考来源
1. McIntosh, Leslie D., et al. (2026). Forensic Scientometrics Report. DOI: 10.6084/m9.figshare.32178456
2. Publishing Perspectives: FoSci Releases Report Analyzing Growing Threats to Research Integrity. https://publishingperspectives.com/2026/05/fosci-releases-report-analyzing-growing-threats-to-research-integrity/
夜雨聆风