
昨天,一件可能要被写进中国学术史的事,悄悄发生了。
《华东师范大学学报(教育科学版)》——一本北大核心、CSSCI双料在册的正经C刊——在同一期里,围绕一场“AI一作”实验,集中发了8篇文章。其中5篇的第一作者,不是哪位教授、哪个博士,而是DeepSeek、Gemini、Generative AI Assistant;另外3篇,是人类学者写下的反思与全景报告。知网上白纸黑字,发表日期2026年6月25日。他们自己给的定性是:“全球首个‘AI一作’大型社会实验。”
消息一出,朋友圈两种声音吵翻了天。一种是“狼来了,学术要完”;另一种是“新时代万岁,太牛了”。
但我想说一句可能不讨喜的话:如果你急着在这两边站队,那你大概率,没看懂这件事。

先把事实说清楚。
2025年9月,华东师范大学教育学部发起了一个叫“AI一作”的大型社会实验。规则很简单:投稿论文必须由AI系统主导创作,AI必须被列为第一作者,人类科研人员只能排后面,当共同作者或通讯作者。
消息一出,炸了锅。支持的说这是“探索智能时代科研新范式”,反对的说这“令人啼笑皆非”,让一个“无行为能力者”占据核心责任位置,击穿了学术“神圣的底线”。国内不少期刊随即发布声明:不接受任何AI工具作为论文署名作者。《自然》《科学》等顶刊也早就明令禁止AI署名。
华东师大没停。
征稿持续了三个多月,收到来自9个国家的724篇有效投稿,1177名人类作者参与。87.6%的投稿者来自高等院校,连高中生都投了稿。超过100种AI工具扮演了“第一作者”:DeepSeek占了三成以上,豆包、ChatGPT、Gemini、Kimi全上了。
2026年3月21日,成果发布。专家组在评审中发现,现阶段人机协同的成果暂未完全达到传统学术“奖项”的高度与成熟度,于是将原计划的“评奖”改为“发布榜单”。10篇“人机共创先锋论文”入选榜单。然后,这些论文进了C刊。
这就是这件事的来龙去脉。
很多人一看到“AI一作”就急着下判断,但这两个最常见的反应,其实都没说到点子上。
第一,它不是技术突破。 AI能写论文,早就不是新闻了。ChatGPT能生成学术文本,DeepSeek能做文献综述,这些能力一两年前就已经被反复讨论过了。华东师大没有发明任何新的AI技术。
第二,它更不是学术造假。 恰恰相反,这是华东师大教育学部公开发起的实验,袁振国、张治领衔,光明正大,明牌在干。每篇论文都附有《AI生成内容说明表》,强制披露AI到底干了什么。在当下的学术界,这5篇反而是最诚实的。
真正的学术风险,从来不是这种光明正大的“AI一作”,而是那些藏起来、假装是自己写的“AI代笔” 。
张治说得很直白:“当前硕博论文的AI渗透率已超70%,很多学生偷偷用AI辅助写作却不敢标注,这种‘地下状态’才是对学术规范的最大破坏。负责任的大学不能当鸵鸟。”
华东师大没有发明新东西,它只是做了一件需要勇气的事——把这个人人在用、人人不提的潜规则,从暗处拖到了明面上。
如果你只看到“AI能写论文了”,那你还是只看到了最表层。
它的本质,是一次制度事件。
一本正规C刊,第一次正式地,把“第一作者”这个学术制度里最核心、最具象征意义的位置,让给了AI。注意,关键词不是“AI能写”,而是 “制度公开承认了它” 。
在学术圈,第一作者不是随便写写的。第一作者意味着你承担了大部分研究工作,提供了最多的智力贡献。意味着你要对数据的真实性负责,对结论的可靠性负责,对整篇论文的学术诚信负责。出了问题,学界第一个找的是你,期刊第一个问责的也是你。“作者”这两个字,背后是一套运行了几百年的责任、荣誉与诚信体系。
现在这个位置,第一次被正式让给了一个大语言模型。再往里看一层,它真正干的事,其实是两个字——显形。
我们心知肚明:AI早就深度参与科研了。它藏在致谢的一行小字里,藏在“仅作语言润色”的托词里,藏在无数篇假装纯手工、实则AI代笔的论文背后。华东师大没有发明什么新东西,它只是把潜规则从暗处拖到了明面上。
看待这件事,我建议你换掉脑子里那把“取代还是不取代”的尺子。这把尺子,一上来就把问题问错了。
正确的视角,是 “工序重组” 。
科研,从来不是一个浑然一体的动作,它是一条流水线:选题、查文献、设计、收数据、跑分析、写初稿、解释、下结论、负责任。AI的到来,不是把这条线整个端走,而是把这条线重新切分——数据处理、仿真模拟、文献整理、初稿撰写,这些环节正在大规模地交给AI;而提出真问题、做价值判断、解释意义、为结论负责,这些环节,依然牢牢攥在人手里。
你看这一组论文的构成就懂了:5篇是AI真刀真枪下场做的实验,另外3篇——胡岩、张治、袁振国写的——是人类在旁边写“我们为什么要做这件事”“做完之后该如何思考”。AI接管了“怎么做”,人退守到了“做什么、为什么、值不值、对不对”。
正如北京大学社会科学部部长初晓波所说:“当人类学者退居‘二作’,我们并不是要让渡主体性,而是在探索一种新的写作可能,让AI处理数据的广度与研究的严谨,让人类守住思想的温度与价值的温度。”
这不是谁淘汰谁,而是分工的边界,正在被重新划定。
至于那两种廉价的反应——“学术要完了”和“新时代万岁”——我的态度是:都太轻了。一个成熟的研究者,应该把它当成一个需要长期观察的治理试验,而不是一道逼你立刻举手表态的立场题。
当然,这不是说“AI一作”没有问题。恰恰相反,它暴露出来的问题,每一个都触及学术体制的根基。
最核心的悖论:责任谁来担?
AI能担什么责?它没有自主意识,没有道德判断能力,无法为其生成内容的真实性、准确性及伦理合规性负任何责任。它连“责任”两个字都理解不了。
实验也暴露了问题:12.71%的投稿论文被查出存在“文献绝对虚假”的幻觉问题。AI在灵感激发、信息处理、文本润色等环节优势显著,但存在文献虚构、逻辑空心、创新不足、伦理隐患等局限。出了学术不端,谁来背锅?AI吗?它连个法人资格都没有。
更深层的冲击:评价体系面临重构。
人类作者退居二作、三作,署名顺序排在AI后面。在现行的学术评价体系里,非第一作者的贡献怎么认定?非升即走的考核表上,第二作者算不算数?评职称、拿项目、拿帽子,谁认你是二作?
一个更尖锐的问题:如果这篇论文得了奖、拿了基金,功劳算谁的?是提供提示词的人类,是训练模型的团队,还是AI本身?说不清楚。
正如实验报告所揭示的,AI写作既催生效率革命,也摧毁旧价值。在AI驱动社科研究的语境下,若研究仅停留在观点的凝练演绎和论证逻辑的调整,这类论文已丧失学术价值。
虽然挑战重重,但这场实验本身已经指出了几条可能的路。
第一,倒逼评价体系改革。
逻辑很简单:当“产出一篇合格的C刊论文”不再是人类的专利,以论文论英雄的评价体系必然被动摇。这未必是坏事——可能迫使学术界重新思考:什么才是真正值得评价的?是论文数量,还是提出真问题的能力、做出价值判断的见识?原有的以数量、期刊、引用率为主的标准,已难以适配AI时代的科研生态。
第二,推动规范从“鸵鸟政策”走向“透明治理”。
目前国内不少期刊明确表示不接受AI作为署名作者。但华东师大的实验提供了一个替代思路:不是禁止,而是强制披露、明确分工。张治说得好:“不做风险更大。”与其让AI在灰色地带无序使用,不如主动搭建一个实验场,在可控的环境下探索人机协作的边界。
第三,探索人机协同的新范式。
实验揭示了一个可能的方向:AI去处理数据的广度,人类守住思想的深度与价值的温度。AI是“副驾驶”,人类紧握方向盘。关键在于找到分工的新边界。
华东师范大学副校长雷启立说得很清楚:“AI一作”本质上是一次真实场景下的压力测试,“不是哗众取宠,更不是说要用AI替代学者,而是希望在真实的场景中发现问题、暴露矛盾,为人机协同时代的学术规范、伦理秩序、出版范式的重构,提供实践的依据和中国方案。”
写在最后
回到最初的问题:AI当了一作,学术会怎样?
我的答案是:不会怎样。
论文还是那些论文,实验还是那些实验,真问题还是需要人来提,价值判断还是需要人来下,责任还是需要人来担。AI能写出一篇格式规范、论证严谨的论文,但它问不出“教育公平如何实现”这种问题,也判断不了一篇论文的学术价值到底有多大。
这场实验真正撼动的,不是学术的根基,而是一套运行了几百年的署名制度和评价体系。它把一个人人在用、人人不提的潜规则摆到了台面上,逼着整个学术界——期刊、高校、评审、学者——重新回答一个根本性的问题:
在AI深度参与知识生产的时代,我们到底应该怎么评价一个人的学术贡献?
这个问题没有标准答案。但华东师大用724篇投稿、1177名人类作者、100多种AI工具,做了一次勇敢的投石问路。
而我们这些围观者,与其急着站队,不如认真想一想:当AI能胜任论文的一作,你作为学者的核心价值,还剩什么?



夜雨聆风