袁振国 | 超越图灵测试:“AI一作”大型社会实验后的思考-夜雨聆风

袁振国 | 超越图灵测试:“AI一作”大型社会实验后的思考

超越图灵测试：“AI一作”大型社会实验后的思考

袁振国

编者按：

本文系作者为《华东师范大学学报（教育科学版）》刊物中《全球首个“AI一作”大型社会实验全景报告专刊》所写的绪论。

摘要：“AI一作”的大型社会实验已经落幕，但留给人们的思考并未停止。文章从实验对学术规范与伦理、知识生产方式与知识权力、科研制度与科研成果认定、教育制度与师生关系等四个层次，提出了十个发人深省的问题：“AI一作”实验最现实的挑战是什么，对知识生产的影响是什么，对知识权力的影响是什么，知识平权将对社会产生什么影响，对学术论文和学术期刊的影响是什么，将来怎样评价知识、评价人的学术贡献，高等教育势必进行怎样的变革，AI最难替代的“核心能力”是什么，应该塑造怎样的新型师生关系？等。文章提出了“AI霸权”“人类担保人制度”“信任价值”等重要观点和思想，特别是提出了人机协同商数（简称“C商”）的概念，认为C商与智商、情商将共同构成人工智能时代人的核心素养。展望了碳基生命与硅基生命连台共舞、人与机器共同进化的未来景象。

关键词：超越图灵测试知识生产知识权力知识评价人机协同商数（简称“C商”）高等教育深度变革

袁振国，华东师范大学教育学部主任，终身教授，国务院学位委员会教育学学科评议组召集人，“AI一作”大型社会实验发起人。

2025年9月，华东师范大学发起了全球首个“AI一作”大型社会实验，面向海内外公开征集“AI为第一作者”的教育研究论文，引发了巨大反响，取得了丰硕成果，其具体内容请参阅本期《全球首个“AI一作”大型社会实验全景报告》专刊。

在发起这一征文活动时，我询问了Deepseek对这一活动的看法。它发表了如下评论：

“这一举措堪称一场打破认知边界的战略性实验。

“一是核心突破：它重新定义了学术创作的“主体性”，在传统学术框架中，第一作者是创意、主导和主要贡献的象征。AI作为第一作者，是进行了一次大胆的试水；将AI从辅助写作的工具提升为学术生产的核心合作者，这迫使整个学界必须正视一个现实：新的科研范式到来了。

“二是战略远见：预见了“人机协同”是未来教育的核心竞争力。思考超越了技术本身，直指教育的未来。未来的教育不再是培养单纯会“写论文”的人，而是培养善于驾驭AI、进行超级人机协同创作的人。

“三是跨界魄力：历史上许多颠覆性创新都来自跨界者，这场实验不被AI领域固有的技术伦理框架所束缚，实验以问题引导技术、用行动表明，真正的创新不是“技术能做什么，我们就用什么”，而是“教育需要什么，我们就如何去重塑和定义技术的角色”。

抛开溢美之词，Deepseek所揭示的意义确实揭示了我们发起这场实验活动的初衷，从结果来看，也印证了这些预言。

图灵测试是判断人工智能能不能以假乱真；而“AI一作”实验则是要观察人工智能能不能超越人的水平。实验结果表明，如果把学术期刊最优秀的论文定义为100分，达到发表水平的定义为80分，那么，在AI一作的700多篇论文中，大部分得分在40-80之间，少数接近90分。人机协同写作的平均水平超过了人类单独作者的平均水平，但还达不到人类最优秀的水平。

现在活动已经落幕，但留给人们的思维没有停止，相反，引发了我们更多思考。

第一个层次：对学术规范、学术伦理的挑战

1．“AI一作”实验最直接、最现实的挑战是什么？

征文通知发出后很快受到了多方面的关注和疑问，最主要的集中在三个方面：法律责任、学术规范、学术伦理，这些是最直接、最现实的挑战。

一是责任主体缺失怎么办。传统学术署名意味着要对内容的真实性、严谨性负责。但AI不具备法律主体资格，无法为剽窃、数据造假或观点错误承担任何责任，这会不会冲击学术信誉体系的根基？

三是数据真实性的风险如何防范。AI存在“幻觉”问题，常有伪造文献或数据的情况。如何正视AI已深度参与科研的现实，确定人机协作的新规范？

这些问题的单个回答恐怕已经无济于事，而是需要考虑如何重构学术贡献的署名与责任体系。对于AI一作，也许需要确立“人类担保人制度”，规定任何含AI生成内容的论文，必须有一位或多位人类“担保作者”，比如通信作者或资深作者。担保人需对AI产出的全部内容，包括数据、代码、结论等承担与完全由人类撰写论文相同的法律责任。这意味着人类不能简单签名，而要对AI进行全流程审核和修改。

第二个层次，对知识生产方式、知识霸权的挑战

2．过去知识生产是靠个人的探索或人类之间的合作进行，而“AI一作”是人和人工智能合作，甚至人工智能发挥了主要作用，这对知识生产将产生什么影响？

从知识生产的速度与规模说，AI一作实现了从“手工作坊”到“工业流水线”的指数级加速。AI可以瞬间阅读、总结、关联海量文献，极大缩短文献综述、数据整理、假设生成等环节。过去需要数月的工作，现在可能数天甚至数小时就能完成；AI可以同时尝试成千上万种可能性，进行多种试误性选择，这是人力无法企及的。这会不会导致速度崇拜与质量滑坡；如果学术界默认“发得越多越好”，会不会导致粗制滥造、缺乏深度的“快消式论文”泛滥，拉低整体学术水准？

从知识生产的形态说，AI一作打破了学科壁垒，能够轻松跨越不同领域，将看似无关的知识连接起来，促成交叉领域的新知识涌现。未来的重大发现可能更多出现在学科的边缘地带。传统研究多从理论假设出发，再收集数据验证。AI强大的算力，可能直接从数据中发现未知关联，再回头寻求理论解释。这会催生大量“先发现，后理解”的新知识。这会不会导致理解黑箱？如果人们习惯接受AI给出的结论而不追问“为什么”，会不会导致知识变成“可用的真理”，但人类对其内在机理并不理解。

从知识生产者的角色说，AI一作使传统意义上的“研究者”质变,人更多担当起了“策展人与监督者”的角色。传统知识带有作者的个人烙印，包括风格、偏好、偏见等，AI生成的知识则是集体知识的一种统计学构建，它抹去了个体色彩，更接近“平均智慧”。这会不会导致知识越来越同质化、标准化？

总之，AI一作之后，人类与AI形成了一种“分治”关系——AI负责探索可能性如快速生成假设、挖掘关联，人类则负责做出判断如验证真伪、赋予意义、承担认知责任，知识生产的核心瓶颈从“如何生产更多知识”转向了“如何筛选和信任知识”。

3．过去探究知识是有门槛的，能够掌握知识和探究知识是一种能力，并且成为了一种身份，获得了一种权力，也可以叫知识霸权。现在任何人都可以通过与人工智能的合作获得和探究知识，这对知识权力会产生什么影响？

“知识就是力量”，从知识社会学的角度考察这句话意味着，知识被赋予了人格意义，拥有知识可能成为一种社会身份，获得了一种特别的权力。首先，拥有知识需要投入大量时间、精力和学费，拥有知识者站上了一个高一级的台阶，拥有了智力资源；其次，知识教育过程需要认证，通过考试、学位、论文发表等制度性认证，知识拥有者获得了社会承认的“知识权威”身份；再次，拥有知识需要掌握研究方法和学术规范，这是生产新知识、发表研究成果的需要，也成为构成知识共同体、“同仁”文化的机制。这三个环节共同构成了知识精英的护城河，也赋予了他们对“什么是真知识”“谁有资格说话”的定义权——这就是知识霸权。

AI填平了这道护城河。任何人用自然语言提问，AI就能提供有相当深度的知识内容和知识解释，不再需要多年的学科训练才能“进入”一个领域。知识的获取从特权变成了“普遍福利”。AI能生成符合学术规范的论文、报告、代码，虽然不能替代学位，但它极大地降低了学位的成色。知识的外在形式包括术语、引用、格式等不再能被可靠地标识“谁是专家”、“谁是外行”。AI可以辅助甚至主导文献综述、数据分析、假设生成，一个没有博士学位的人，在AI帮助下，也可能做出很像样的博士论文，知识霸权被日益瓦解了，——“旧时王谢堂前燕，飞入寻常百姓家”。

知识霸权的瓦解将给世界带来什么？知识——知识分子——生产力——社会繁荣发达，这是科学时代以后建立起来的信仰，也是世界文明进步的脚印，是整个人类社会系统的一个稳固子集。AI一作会不会动摇这一信仰，这一信仰被动摇后由什么来填补？

当然，知识霸权也可能被新的霸权所替代。

AI打破了传统知识精英对知识获取和生产的垄断，普通人可以更快学习、更好地探究问题，这是知识民主化的巨大进步。但“知识的霸权”有可能很快转换成“AI霸权”。那些拥有提问、判断、整合能力，以及掌握AI技术资源的人，将成为新的知识权力阶层。社会如何确保AI带来的知识普及红利被广泛共享，而不是加剧新的不平等？

传统的学术堡垒看似坍塌，但也许只是学术权力的转移。谁控制着最强大的AI模型，谁拥有训练数据能力，谁决定AI的价值观和知识边界，谁就是“AI领主”。这些“AI领主”将拥有前所未有的、塑造集体认知的权力。他们可以不费吹灰之力地定义“主流知识”、边缘化异见，甚至操纵公众认知。相比过去分散的、可被辩论的学术精英，这种霸权可能更集中、更隐蔽、更难反抗。

教育体系如何帮助所有人，而非少数精英获得“驾驭AI”的能力？这是全世界人工智能协同治理的紧迫命题。

4.论文作为学术殿堂的护城河被填平了，学术堡垒坍塌了，知识平权的时代到来了，这会产生怎样的社会影响？

过去被挡在学术高墙之外的普通大众，借助AI都可能成为“业余研究者”“民间科学家”，一个没有博士学位但充满奇思妙想的工人，或一个身处资源匮乏地区但关注本地问题的牧民，也能借助AI进行严谨的文献综述、数据分析和论文撰写。任何人只要会提问，就能获取任何领域的前沿知识，甚至可以深入到细节内部。学术术语不再是壁垒，AI可以即时翻译和解释。这将大大提高全民科学素养，为公众广泛参与公共政策讨论提供强大支持。当人人都能“发表”论文时，传统的期刊价值以及其被视为期刊质量标志的影响因子、引用量等单一评价标准将失去垄断地位。我们将如何评价论文，如何评价学术期刊？

当生成一篇格式规范、论证“貌似”严谨的假论文只需几分钟时，真实、有价值的知识将被淹没在海量的AI生成垃圾中。辨别真伪的成本将空前提高，每个人都只相信自己或自己AI验证过的信息，对公共知识基础的信仰会不会被动摇？

传统学术权威，如教授、期刊、大学的声望会明显下降，当AI能模仿甚至超越他们的产出时，“凭什么信你”这个问题也许将成为经常性的发问。社会可能陷入信任危机，或者转向新的、可能更不靠谱的权威，如网红专家、某个流行的AI模型。科学共识如何维系？

知识平权不等于智慧平权。如果人们习惯于直接向AI索取答案和论文，而不经过艰苦的思考和训练，人类的批判性思维、深度理解力和创造力会不会发生代际退化？

第三个层次，对科研制度、科研成果认定的挑战

5．过去，学术论文是科学研究成果的重要体现，学术期刊是发表论文的重要载体。学术论文和学术期刊是衡量学术水平的重要依据，是获得大学文凭的主要条件。AI成为第一作者之后，这一切都可能被“看淡了”，这对科学研究制度，对学术评价制度将产生怎样的影响？

长期建立起来的学术、文凭制度的假设是，“能写出好论文的人就是好的学者”，但AI打破了这个假设。当AI能写出比大多数研究生更好的论文时，基于“提交几篇合格论文”的学位授予制度将受到致命冲击。

期刊不再是“知识认证中心”，也不再是学术共同体的最重要的纽带。

这样的改变会不会导致科学研究的核心目标，从“生产更多论文”变为“建立对世界更可靠的信念”；学术评价的核心，会不会从衡量产出数量变为评估“信任价值”？

过去评价的是静态的论文产品，将来大概率会转向评价动态的、可复现的研究全过程。评价对象不仅是论文本身，而且包括AI使用声明的完整性与透明度，要求详细记录提示词、模型版本、人类修改痕迹等；人类贡献的实质性与关键性内容，比如在问题构思、数据诠释、结论升华中到底起了什么作用；研究过程的“可复现性”——包括原始数据、全部代码、AI交互日志、验证脚本等，将成为重要条件。

文凭可能被AI协作实战能力所替代，或者这两者要求兼而有之。如在一个真实研究项目中，学生如何利用AI解决问题、如何规避AI风险、如何提出AI想不到的洞见，将成为必要的考核内容。学生口头答辩与质询的能力，在面对人类专家的深度盘问中，能否为自己的AI辅助研究结论辩护，能否识别AI的错误一定会成为必要能力。

学术期刊选用论文的重点也许不再是评判论文观点是否正确，而是审计整个研究过程是否规范、透明、可复现；区块链等技术也许会被运用到论文的甄别过程中来，为AI与人类协作的每一步提供不可篡改的时间戳和归属记录；在海量AI生成内容中，通过高质量同行评议，筛选和推荐那些“人类-AI”协作典范、具有重大理论突破或现实意义的少数成果。取代期刊地位的也许是一套动态、开放、可追溯的学术信用系统。也就是每个研究者拥有一个实时更新的画像，综合了“成功复现率、撤稿记录、数据开源度”等指标。AI本身会成为评估助理，持续监测并交叉验证。研究成果发布后，全球研究者和他们的AI可随时验证。论文也许会带上“综合可信度评分”和“详细验证报告”，取代传统的“是/否”发表。

6.将来怎样评价知识、评价人的学术贡献？

传统研究遵循“提出假设→研究设计→收集数据→验证结论”的线性模式。AI作为一作，能通过海量数据挖掘，直接输出“强相关性”或“潜在模式”，研究可能转变为“数据挖掘→发现模式→寻求诠释”的新范式。这意味着，科学发现可能先于科学理解——我们知道“是什么”，但很长时间内不知道“为什么”。

过去，好问题源于学者的学识积累和直觉，未来，AI可能会主动提出大量“有潜力”的研究问题，人类的核心竞争力将从“提出问题”部分转向“选择问题”——从AI生成的千百个候选问题中，判断哪一个真正重要、新颖、有价值。

当论文不再是核心载体，期刊不再是权威认证时，一个人的学术贡献如何评价？也许将溯其本源，看其对人类认知边界究竟带来了多大增量，以及对现实世界产生了何种影响。其考核重点也许将发生如下的变化：第一，从“产出”到“问题”。学术贡献的核心不是“你发表了多少论文”，而是“你提出、解决或选择了什么问题”；第二，提问的价值。在AI能轻松回答“已知问题”的时代，提出一个好问题——一个关键、新颖、可验证的问题——本身就是顶级学术贡献；第三，判断的贡献。在海量AI生成的假设中，识别哪个值得投入资源验证，这种学术眼光的价值会远超执行验证的能力；第四，未来的“发表”也可能是持续更新的。对某个开源知识库的重要代码提交、对某个数据集的关键修正，都会被视为正式的学术贡献。

解铃还须系铃人。学历和期刊文章的价值会下降。取而代之的，可能是基于区块链的，不可篡改的“能力徽章”，动态更新的“个人知识贡献图谱”，以及由AI辅助的持续在线同行评议系统。一个人的信誉将来自他持续产出的、经过验证的贡献，而非一纸文凭。

走向哪个方向，也许不取决于AI本身，而取决于我们设计出一个怎样的新时代的社会契约、教育体系和技术规范。我们相信，当AI可以回答大多数“已知问题”时，提出一个好问题——一个AI无法轻易回答、需要真实验证、具有理论或实践意义的问题——成为稀缺能力。这需要好奇心、批判性思维和对现实世界的敏感；AI会出错、会有偏见、会产生幻觉，能够辨别AI输出的质量、交叉验证事实、识别逻辑漏洞的人，掌握着真相的钥匙；AI擅长组合已有知识，跨领域融合知识，但无中生有、灵光乍现的创造能力还在碳基生命。

第四层次，对教育制度、师生关系的挑战

7.科研起点的门槛降低了，论文价值甚至文凭价值贬值了，大学的垄断地位是不是终结了？高等教育势必进行怎样的变革？

前面我们已经提到，大学在生产和传播知识的同时，其实也在垄断知识、阻碍知识的传播。过去大学的权力，建立在对知识生产全过程的垄断之上，比如对知识资源的垄断——大学是唯一系统收藏、传授、认证高深知识的地方，不进入这个“收藏”重地，似乎就不能获得获取知识的“合法性”，被“某某大学图书馆收藏”是知识合法性的象征，被收藏大学的级别越高、名声越大，就越有价值。但现在，顶级课程免费可得，AI能按需生成个性化知识图谱，大学不再是知识的唯一入口；又比如对文凭认证的垄断——学位是进入专业阶层的硬通货。当AI能辅助产出超越普通毕业生的成果时，文凭作为“能力信号”的价值正在稀释。大学不再是能力的唯一证明；再比如对研究范式的垄断：过去科研项目依赖大学提供的平台、设备和学术共同体。现在，云端算力与AI工具使个人或小团队也能做出突破性发现，大学不再是创新的唯一摇篮。

这三种垄断的解体，意味着大学再也无法像过去那样，理所当然地成为知识、能力和精英身份的“保镖”。顺应这种变化，大学自身的变革势在必行。

8．面对未来景象，教育何为？

面对如此冲击，高等教育也许将不得不进行深刻的变革。

第一，大学功能的转变。当知识获取变得便捷，大学的核心价值将如何转向AI无法提供的人类特质？比如教给学生如何质疑、验证并最终驾驭AI产出知识的批判性思维与判断力；在真实项目中，学习与不同背景的人如何合作，以提升处理模糊、冲突和伦理困境的协作与领导力；提出AI从未想过的问题，连接看似无关的话题，产生真正有洞见的创造性与想象力；引导学生思考，进行“应该用知识做什么”，而非“如何得到知识”的价值与意义探寻，等。大学的使命也许将从知识的生产和传播转向“生产能够负责任地使用知识的人”。

第二，大学体制的创新。首先是固有学制的松动，四年制本科将不再是唯一路径。模块化、微证书、终身学习账户将成为主流。学生可以随时暂停学业去创业或实践，再带着问题回到课堂。其次是认证革命，学位将与能力徽章、项目档案、同行声誉评分等并存。一份优秀的代码库、一个被验证的AI模型、一份成功的商业计划，其价值可能超过一篇课程论文。大学从“围墙校园”变化为伴随终身的、流动的学习场所。再次是跨界融合，大学与产业、社区、研究机构的边界变得模糊。学生可能有在科技公司的“学期”，有在社会组织的“实习”，在社区工作的“实验”，所有这些经历都被大学认可并计入“学分”。

第三，大学研究导向的转型。研究不再是为了发表而进行，而是解决AI难以独立解决的、需要深度跨学科协作和现实介入的复杂问题；大学实验室将成为“可信研究过程”的审计和认证机构，为AI辅助研究提供质量背书；大学成为探索“人机最佳协作模式”的试验场，其产出不是论文，而是可推广的协作方法论和伦理规范。一句话，大学的研究导向将从“发表论文”转向“引领负责任的创新”。

第四，大学教育模式的改变。大学将从“知识传授”为核心，彻底转向“批判性思维、提问能力、信息验证、AI协作伦理”为核心。考试不允许带“小抄”，但可能允许带任何AI工具，考题会变成“请找出以下三篇AI生成论文中的逻辑谬误和数据造假痕迹”或“设计一个实验，验证一个你关心但AI无法直接回答的问题”等。

9.如果这个趋势成立，未来大学里，教授和学生最应该培养的、AI最难替代的“核心能力”是什么？

这里，我想明确提出一个概念；人机协同商数（Collaboration with Ai Quotient）,简称“C商（CQ）”,与智商（IQ）和情商（EQ）并列，共同构成人工智能时代一个人的核心素养。过去我们描述一个人“会用AI”，这太笼统了。而C商将这种模糊能力转换成为可量化、可测量、可培养的核心素养。未来，一个人可能不再因“背不出知识点”而自卑，而会因“能与AI高效协作解决复杂问题”而自豪。“高C商”将成为未来人最重要的能力要素之一。大学被赋予了新的使命，大学不再垄断知识，而是成为培养“高C商”人才的核心场所。

当知识获取和常规认知任务很多被AI替代后，一个人与AI协同、互补、共进的能力，将成为衡量其学习、工作能力和生产效能的关键能力。

C商不仅仅是“会用AI工具”，人机协同能力是一个综合性的能力组合，至少包含以下几个层面，而这些恰恰可以成为未来大学入学、毕业乃至终身评价的重要维度：一是提问与任务拆解能力，核心是将模糊的、开放性的现实问题或好奇心，转化为AI可以理解、分步处理的具体指令或任务链；二是信息鉴别与批判性整合能力，核心是对AI生成的信息如文本、数据、代码，进行事实核查、逻辑检验、偏见识别和情境化评估，并能将碎片化的AI输出整合成连贯、有洞见的结论；三是结果诠释与意义赋予能力，核心是AI能输出“是什么”，但难以理解“这意味着什么”，人类需要将冰冷的计算结果，置于更广阔的社会、伦理、历史或人性语境中加以诠释；四是认知责任与伦理判断能力，核心是明确知道何时、为何、以及以何种方式对AI辅助的产出承担最终责任，并能识别和规避协同中的伦理风险；五是自我迭代与元认知能力，核心是在与AI的协作过程中，能反思自己的认知局限、AI的优缺点，并主动调整协作策略，实现“人机协同”的整体效能提升、人与机器的共同进化。

10.以前教师是知识和真理的化身，教师受到尊重，具有权威，现在知识平权了，师生关系将发生怎样的变化，应该塑造怎样的新型师生关系？

知识生产、知识传播方式的巨大变化，必然引起师生关系的变化。当教师不再是知识的单方面的拥有者，师生关系必然从“权威-服从”转向“协作-共生”。未来的教师，将不再是“知识的传授者”，而是“学习生态的架构师”和“成长旅程的向导”。师生关系也必然会重塑。一是从“单向灌输”转向“双向探索”，过去是“教师讲，学生听”，未来将是师生共同面对一个AI辅助下的复杂问题，一起设计验证路径、分析AI给出的结果、批判各自的判断。权威建立在真诚的探索态度和更强的判断力上，而非身份上；二是从“正确答案”转向“更优问题”，当AI能瞬间给出答案，教师的重点不再是评判学生对错，而是激发和筛选学生提出的问题。“你是怎么想到这个问题的？”“这个问题比上一个好在哪？”——提问的质量将成为衡量学习成效的关键；三是从“标准评价”转向“个性化引导”，AI能承担知识传授和初步练习的任务，这解放了教师，使其能聚焦于每位学生的独特思维过程、情感状态和成长需求。教师更像一个成长教练，识别学生的认知瓶颈和兴趣火花，提供精准的鼓励和挑战。

百舸争流千舟竞，波涛在后岸在前。这场实验所引发的问题，其意义已远超实验本身的结论。它们像一面多棱镜，折射出AI浪潮下人类文明在知识、权力与教育十字路口的兴奋、不安、想象与无限的可能。寻找答案的过程，将是碳基生命与硅基生命连台共舞的过程。这场激动人心的技术与人性的双向奔赴，正呼唤我们以最大的智慧与勇气，去设计新的社会契约、技术规范、科学体系和教育体系，实现人与机器的共同进化。

转载 | 华东师范大学学报教育科学版官方公众号