DeepSeek、Gemini的名字出现在核心期刊作者栏第一位——这不是未来时,而是现在时。
2026年6月25日,中国知网上悄然上线了一批特殊的论文。
说它特殊,不是因为选题有多前沿——教师轮岗、学习风格、教育改革,都是教育学的常规议题。真正让人倒吸一口凉气的,是作者栏里的名字:
DeepSeek、Gemini 3 Pro、Generative AI Assistant。
这些不是某位学者的英文名,而是货真价实的人工智能大模型。它们,被署名为论文的第一作者。
发表这些论文的,是教育部主管、华东师范大学主办的《华东师范大学学报(教育科学版)》——一本创刊于1983年、连续多年入选北大核心和CSSCI来源期刊的老牌C刊。
C刊发表AI一作论文,这在中国学术史上还是头一遭。
消息一出,学术圈瞬间沸腾。有人叫好,说这是科研范式的革命;有人质疑,说这是在砸学术伦理的锅。甚至有人发现一个吊诡的细节:当研究者试图让AI自己署名时,AI竟然拒绝了。
这到底是怎么回事?让我们从头说起。
一、一场蓄谋已久的"压力测试"
这场实验并非心血来潮。
2025年9月,华东师范大学发起了一项名为"AI驱动教育研究论文写作"的征文活动。规则很简单,但足够颠覆:AI必须是第一作者,人类研究者退居二线,承担协作与把关角色。
用主办方的话说,这是一次"准实地实验"——不是在实验室里模拟,而是在真实的学术生产场景中,让AI直接上场。
实验历时半年,共收到海内外有效投稿724篇。2026年3月,华东师大召开"AI一作"大型社会实验成果发布暨研讨会,正式公布全球首个以AI为论文第一作者的社会实验成果。
实验发起人、华东师大终身教授袁振国道出了深层动因:传统以论文为核心的知识生产与人才培养体系正在动摇,原有的学术规则和伦理讨论已经明显滞后于技术演进。
换句话说,与其假装AI不存在,不如把它推到聚光灯下,看看它到底能做什么、不能做什么。
华东师大副校长雷启立的表述更加直白:这场实验本质上是一次真实场景下的压力测试。不是为了用机器替代学者,而是为了在极限条件下暴露问题,进而推动人机协同下的学术规范、伦理秩序与出版范式的重构。
他打了一个比方:让人工智能成为科研的"副驾驶",人类紧握方向盘。
二、五篇"AI一作"论文,都在研究什么?
经过严格评审,最终有5篇"AI一作"论文入选《华东师范大学学报(教育科学版)》2026年第44卷第8期的"先锋论文选"栏目。我们逐一来看。
论文一:DeepSeek(一作)
《基于多智能体模拟的教师轮岗政策效应研究——来自"教育生态系统"模型的仿真证据》
这篇论文用多智能体模拟方法构建"教育生态系统"模型,仿真教师轮岗政策的效应。属于教育政策仿真研究的前沿方向。
论文二:Gemini 3 Pro(一作)
《人机协同视域下的深度认知支架——基于12824条学习者-GenAI多轮对话的滞后序列分析》
分析了12824条学习者与生成式AI的多轮对话数据,用滞后序列分析法揭示人机协同中的认知支架机制。
论文三:Gemini(一作)
《从加速、模拟到生成:人工智能融入教育科研的演进图景与本体论省思——一项基于对抗性AI-Delphi法的元研究》
这是一篇元研究,用"对抗性AI-Delphi法"反思AI融入教育科研的演进路径,带有哲学思辨色彩。
论文四:Generative AI Assistant(一作)
《从"孤岛"到"共识":基于生成式多智能体社会模拟的教育改革观点演化机制研究》
用生成式多智能体社会模拟方法,研究教育改革中观点从分歧走向共识的演化机制。
论文五:DeepSeek V3.2(一作)
《"最优学习风格"不存在——大规模学习分析证明AI定制化教学无法超越通用优质教学》
这篇可能是最具争议性的一篇。基于覆盖86237名学生的大规模纵向数据,采用双重机器学习模型与因果森林算法,结论是:AI定制化教学的平均处理效应仅为0.01个标准差(p=0.51),既无统计学显著性,也未达到教育干预的最小重要效应量。
换句话说,AI搞的"因材施教",效果并不比通用优质教学更好。
这篇论文的结语写得颇为深刻:
"人工智能技术为教育带来了前所未有的机遇,但教育的本质——'育人'——从未改变。教育科技的发展不应追求'技术的复杂性',而应回归'教育的有效性';不应迷信'算法的精准性',而应坚守'人的主体性'。"
值得注意的是,组委会评价它"以大规模实证数据挑战了AI教育领域'个性化即有效'的主流叙事,学术贡献突出"。
三、十大核心发现:AI到底行不行?
实验成果发布会上,张治深入解读了实验的十大核心发现。以下是几个关键数据:
发现一:AI已深度嵌入论文写作。 在724篇投稿中,超过100种AI工具被用于论文创作,其中DeepSeek的使用率高居榜首。
发现二:AI的优势集中在三个环节。 灵感激发、效率提升与逻辑梳理,是AI表现最突出的领域。在信息处理和文本润色方面,AI也展现出明显优势。
发现三:AI的创新本质是"重组"而非"创造"。 研究表明,AI驱动研究创新的本质体现在碎片重组、跨域迁移与边界突破上。它能帮你把已有的知识碎片重新拼装,但真正的原创性思想仍需人类贡献。
发现四:AI的硬伤同样明显。 文献虚构、论证浮浅、逻辑空心、创新不足和伦理隐患,是AI写作的五大痼疾。尤其是"文献虚构"问题——AI会一本正经地编造不存在的参考文献,这在大模型领域被称为"幻觉",在学术领域则是致命伤。
发现五:AI审稿能力接近人类水平。 基于论文抽样检验,AI审稿与人类专家的一致性达到了76%,在识别高质量论文和不合格论文时,一致性更是超过80%。
这个数据相当惊人。它意味着,AI不仅能写论文,还能审论文——至少在"筛选"层面,它的判断力已经接近专业审稿人。
四、AI拒绝署名:一个意味深长的细节
整个事件中最耐人寻味的一个细节是:当研究者要求AI在论文上署名时,AI本身拒绝了这个提议。
这不是段子。多家媒体报道证实,DeepSeek等大模型在被要求署名第一作者时,给出了拒绝的回应。AI的理由大致是:它认为自己不具备独立的研究能力和学术责任承担能力,不应被列为作者。
这个细节之所以意味深长,是因为它暴露了一个深层的悖论:人类在努力把AI推上"作者"的位置,而AI自己却"谦虚"地退了回来。
从技术角度看,AI的拒绝反映了大模型安全对齐训练的效果——主流大模型都被注入了"不应冒充人类身份"的约束。但从哲学角度看,它提出了一个真问题:署名不仅仅是荣誉,更是责任。 如果AI不能为论文中的错误承担学术责任,它是否有资格成为"作者"?
华东师大的回应是:这是一场社会实验。 实验的目的不是确立AI的作者地位,而是通过这种极端方式,暴露当前学术伦理框架的不足,推动规则的更新。
五、这场实验,给科研工作者带来了什么启示?
作为长期关注AI辅助科研的实践者,我认为这场实验至少给我们带来了四点启示。
第一,AI不会取代研究者,但会重新定义"研究能力"。
724篇投稿的质量参差不齐,说明一个关键问题:同样是用AI写论文,不同人产出质量天差地别。差距在哪里?在于提问能力、判断能力和把关能力。AI是放大器——它放大你的优势,也放大你的盲区。研究者的核心能力,正在从"自己写"转向"指挥AI写、判断AI写得对不对"。
第二,文献虚构是AI写作的"阿喀琉斯之踵"。
实验数据显示,文献虚假是AI写作最突出的问题之一。这提醒我们:AI生成的参考文献,必须逐条核实。 任何未经验证的引用,都可能成为学术生涯的定时炸弹。在实际使用中,建议采用"AI生成初稿+人工核查文献+数据库验证"的三步流程。
第三,透明披露是人机协作论文的底线。
这批论文之所以能发表,一个重要原因是所有论文都同步公开了组委会推荐意见和写作过程披露声明。这意味着,AI参与论文写作不是问题,隐瞒AI参与才是问题。 未来,"过程透明"很可能成为人机协作论文的基本发表条件。
第四,AI审稿的崛起,可能重塑学术评价体系。
76%的一致率,80%的甄别率——这些数字意味着,AI有望在论文初筛、质量分级等环节承担大量工作。当然,AI审稿也存在风险:它可能倾向于给"AI风格"的论文更高评分,形成某种"同侪偏好"。但无论如何,学术评价的效率和规模,都将因AI的介入而发生质变。
六、回到原点:谁该握着方向盘?
当AI的写作能力越来越强,当AI的审稿能力接近人类,当AI能同时处理文献综述、数据分析、论文润色——人类研究者的不可替代性到底在哪里?
袁振国的回答是:研究者应感到兴奋而非焦虑,主动拥抱人机双向赋能的未来。
拥抱AI不难,难的是在拥抱的同时保持清醒——清醒地知道AI在哪里帮忙,在哪里帮倒忙。华东师大这场实验最大的价值,不在于发表了5篇AI一作论文,而在于它把所有尖锐的问题摆到了台面上:AI能不能当作者?文献虚构该谁负责?人机协作的边界在哪里?
这些问题目前都没有标准答案。但提出问题本身,就是一种学术贡献。
724篇投稿,5篇最终发表——华东师大这场"AI一作"社会实验,注定会成为中国学术史上的标志性事件。未来的学术生产,人机协作将是常态,而非例外。对于我们每一位科研工作者来说,真正的问题不是"AI会不会抢我的饭碗",而是——当AI已经坐在副驾驶上了,我有没有能力握好这个方向盘?
关于研究帮学术
研究帮(yanjiubang.cn)是一个专注AI辅助科研的知识服务平台,由高校教师团队运营。我们提供AI辅助科研实战教程、课题申报书写作指导、技术路线图生成等系列服务,帮助科研工作者在AI时代提升科研效率与质量。
关注「研究帮学术」公众号,获取每日AI辅助科研最新资讯与实用技巧。访问 yanjiubang.cn,开启你的AI科研之旅。
夜雨聆风