
点击蓝字,关注我们
对AI生成论文摘要的鉴别效能
——一项审稿人与AI检测工具的实证研究
黎世莹1), 张 慧1), 吕叶辉2), 姚雪珺1), 余党会3)
1)司法鉴定科学研究院,上海市法医学重点实验室,司法部司法鉴定重点实验室,上海市司法鉴定专业技术服务平台,200063;
2)上海健康医学院基础医学院,201318;3)海军军医大学教研保障中心出版社《海军军医大学学报》编辑部,200433:上海
摘 要 分析审稿人、Artificial Intelligence(AI)和专业检测工具对AI生成内容的鉴别能力,整理描绘主流AI的撰文水平和其生成内容的典型特征。设计双盲实验评估审稿人和生成式人工智能(Generative artificial intelligence,GenAI)对AI生成内容的鉴别准确率;分析国内外出版机构、高等院校与期刊平台针对GenAI颁布的最新政策和导向。研究发现审稿人对论著类AI生成摘要的识别准确率显著高于综述类(91.9% vs. 83.8%,P<0.05),且对全文生成摘要的误判率高于题目生成摘要(28 vs. 11篇次,P<0.05)。AI检测工具(如GPTZero)对生成内容的识别准确率高达90.0%,显著优于大语言模型(ChatGPT、DeepSeek)。国内外政策在AI署名、内容披露等方面存在区域性差异。针对AI生成内容,本文提出构建“算法初筛—人工复核—作者申诉”的审稿模式,让作者合理、规范应用AI撰文,为科技期刊应对GenAI变革操作范式进行初步探索。
关键词 生成式人工智能;ChatGPT;DeepSeek;编辑;作者;审稿人
黎世莹,张慧,吕叶辉,等. 对AI生成论文摘要的鉴别效能:一项审稿人与AI检测工具的实证研究[J]. 编辑学报,2026,38(1):82

完整文章请点击下方“阅读原文”至《编辑学报》官网下载阅读
夜雨聆风