袁振国 | 超越图灵测试:“AI一作”大型社会实验后的思考
超越图灵测试:“AI一作”大型社会实验后的思考
袁振国
编者按:
本文系作者为《华东师范大学学报(教育科学版)》刊物中《全球首个“AI一作”大型社会实验全景报告专刊》所写的绪论。
摘要:“AI一作”的大型社会实验已经落幕,但留给人们的思考并未停止。文章从实验对学术规范与伦理、知识生产方式与知识权力、科研制度与科研成果认定、教育制度与师生关系等四个层次,提出了十个发人深省的问题:“AI一作”实验最现实的挑战是什么,对知识生产的影响是什么,对知识权力的影响是什么,知识平权将对社会产生什么影响,对学术论文和学术期刊的影响是什么,将来怎样评价知识、评价人的学术贡献,高等教育势必进行怎样的变革,AI最难替代的“核心能力”是什么,应该塑造怎样的新型师生关系?等。文章提出了“AI霸权”“人类担保人制度”“信任价值”等重要观点和思想,特别是提出了人机协同商数(简称“C商”)的概念,认为C商与智商、情商将共同构成人工智能时代人的核心素养。展望了碳基生命与硅基生命连台共舞、人与机器共同进化的未来景象。
关键词:超越图灵测试 知识生产 知识权力 知识评价 人机协同商数(简称“C商”) 高等教育深度变革


袁振国,华东师范大学教育学部主任,终身教授,国务院学位委员会教育学学科评议组召集人,“AI一作”大型社会实验发起人。
2025年9月,华东师范大学发起了全球首个“AI一作”大型社会实验,面向海内外公开征集“AI为第一作者”的教育研究论文,引发了巨大反响,取得了丰硕成果,其具体内容请参阅本期《全球首个“AI一作”大型社会实验全景报告》专刊。
在发起这一征文活动时,我询问了Deepseek对这一活动的看法。它发表了如下评论:
“这一举措堪称一场打破认知边界的战略性实验。
“一是核心突破:它重新定义了学术创作的“主体性”,在传统学术框架中,第一作者是创意、主导和主要贡献的象征。AI作为第一作者,是进行了一次大胆的试水;将AI从辅助写作的工具提升为学术生产的核心合作者,这迫使整个学界必须正视一个现实:新的科研范式到来了。
“二是战略远见:预见了“人机协同”是未来教育的核心竞争力。思考超越了技术本身,直指教育的未来。未来的教育不再是培养单纯会“写论文”的人,而是培养善于驾驭AI、进行超级人机协同创作的人。
“三是跨界魄力:历史上许多颠覆性创新都来自跨界者,这场实验不被AI领域固有的技术伦理框架所束缚,实验以问题引导技术、用行动表明,真正的创新不是“技术能做什么,我们就用什么”,而是“教育需要什么,我们就如何去重塑和定义技术的角色”。
抛开溢美之词,Deepseek所揭示的意义确实揭示了我们发起这场实验活动的初衷,从结果来看,也印证了这些预言。
图灵测试是判断人工智能能不能以假乱真;而“AI一作”实验则是要观察人工智能能不能超越人的水平。实验结果表明,如果把学术期刊最优秀的论文定义为100分,达到发表水平的定义为80分,那么,在AI一作的700多篇论文中,大部分得分在40-80之间,少数接近90分。人机协同写作的平均水平超过了人类单独作者的平均水平,但还达不到人类最优秀的水平。
现在活动已经落幕,但留给人们的思维没有停止,相反,引发了我们更多思考。
第一个层次:对学术规范、学术伦理的挑战
1.“AI一作”实验最直接、最现实的挑战是什么?
征文通知发出后很快受到了多方面的关注和疑问,最主要的集中在三个方面:法律责任、学术规范、学术伦理,这些是最直接、最现实的挑战。
一是责任主体缺失怎么办。传统学术署名意味着要对内容的真实性、严谨性负责。但AI不具备法律主体资格,无法为剽窃、数据造假或观点错误承担任何责任,这会不会冲击学术信誉体系的根基?
二是知识产权归属谁。目前各国法律普遍规定,我国也一样,著作权只能授予自然人或法人,AI不能成为权利人。同时,AI的训练数据源于人类集体知识,且难以追溯原始作者,如何认定版权所有者?
三是数据真实性的风险如何防范。AI存在“幻觉”问题,常有伪造文献或数据的情况。如何正视AI已深度参与科研的现实,确定人机协作的新规范?
这些问题的单个回答恐怕已经无济于事,而是需要考虑如何重构学术贡献的署名与责任体系。对于AI一作,也许需要确立“人类担保人制度”,规定任何含AI生成内容的论文,必须有一位或多位人类“担保作者”,比如通信作者或资深作者。担保人需对AI产出的全部内容,包括数据、代码、结论等承担与完全由人类撰写论文相同的法律责任。这意味着人类不能简单签名,而要对AI进行全流程审核和修改。
第二个层次,对知识生产方式、知识霸权的挑战
2.过去知识生产是靠个人的探索或人类之间的合作进行,而“AI一作”是人和人工智能合作,甚至人工智能发挥了主要作用,这对知识生产将产生什么影响?
从知识生产的速度与规模说,AI一作实现了从“手工作坊”到“工业流水线”的指数级加速。AI可以瞬间阅读、总结、关联海量文献,极大缩短文献综述、数据整理、假设生成等环节。过去需要数月的工作,现在可能数天甚至数小时就能完成;AI可以同时尝试成千上万种可能性,进行多种试误性选择,这是人力无法企及的。这会不会导致速度崇拜与质量滑坡;如果学术界默认“发得越多越好”,会不会导致粗制滥造、缺乏深度的“快消式论文”泛滥,拉低整体学术水准?
从知识生产的形态说,AI一作打破了学科壁垒,能够轻松跨越不同领域,将看似无关的知识连接起来,促成交叉领域的新知识涌现。未来的重大发现可能更多出现在学科的边缘地带。传统研究多从理论假设出发,再收集数据验证。AI强大的算力,可能直接从数据中发现未知关联,再回头寻求理论解释。这会催生大量“先发现,后理解”的新知识。这会不会导致理解黑箱?如果人们习惯接受AI给出的结论而不追问“为什么”,会不会导致知识变成“可用的真理”,但人类对其内在机理并不理解。
从知识生产者的角色说,AI一作使传统意义上的“研究者”质变,人更多担当起了“策展人与监督者”的角色。传统知识带有作者的个人烙印,包括风格、偏好、偏见等,AI生成的知识则是集体知识的一种统计学构建,它抹去了个体色彩,更接近“平均智慧”。这会不会导致知识越来越同质化、标准化?
总之,AI一作之后,人类与AI形成了一种“分治”关系——AI负责探索可能性如快速生成假设、挖掘关联,人类则负责做出判断如验证真伪、赋予意义、承担认知责任,知识生产的核心瓶颈从“如何生产更多知识”转向了“如何筛选和信任知识”。
3.过去探究知识是有门槛的,能够掌握知识和探究知识是一种能力,并且成为了一种身份,获得了一种权力,也可以叫知识霸权。现在任何人都可以通过与人工智能的合作获得和探究知识,这对知识权力会产生什么影响?
“知识就是力量”,从知识社会学的角度考察这句话意味着,知识被赋予了人格意义,拥有知识可能成为一种社会身份,获得了一种特别的权力。首先,拥有知识需要投入大量时间、精力和学费,拥有知识者站上了一个高一级的台阶,拥有了智力资源;其次,知识教育过程需要认证,通过考试、学位、论文发表等制度性认证,知识拥有者获得了社会承认的“知识权威”身份;再次,拥有知识需要掌握研究方法和学术规范,这是生产新知识、发表研究成果的需要,也成为构成知识共同体、“同仁”文化的机制。这三个环节共同构成了知识精英的护城河,也赋予了他们对“什么是真知识”“谁有资格说话”的定义权——这就是知识霸权。
AI填平了这道护城河。任何人用自然语言提问,AI就能提供有相当深度的知识内容和知识解释,不再需要多年的学科训练才能“进入”一个领域。知识的获取从特权变成了“普遍福利”。AI能生成符合学术规范的论文、报告、代码,虽然不能替代学位,但它极大地降低了学位的成色。知识的外在形式包括术语、引用、格式等不再能被可靠地标识“谁是专家”、“谁是外行”。AI可以辅助甚至主导文献综述、数据分析、假设生成,一个没有博士学位的人,在AI帮助下,也可能做出很像样的博士论文,知识霸权被日益瓦解了,——“旧时王谢堂前燕,飞入寻常百姓家”。
知识霸权的瓦解将给世界带来什么?知识——知识分子——生产力——社会繁荣发达,这是科学时代以后建立起来的信仰,也是世界文明进步的脚印,是整个人类社会系统的一个稳固子集。AI一作会不会动摇这一信仰,这一信仰被动摇后由什么来填补?
当然,知识霸权也可能被新的霸权所替代。
AI打破了传统知识精英对知识获取和生产的垄断,普通人可以更快学习、更好地探究问题,这是知识民主化的巨大进步。但“知识的霸权”有可能很快转换成“AI霸权”。那些拥有提问、判断、整合能力,以及掌握AI技术资源的人,将成为新的知识权力阶层。社会如何确保AI带来的知识普及红利被广泛共享,而不是加剧新的不平等?
传统的学术堡垒看似坍塌,但也许只是学术权力的转移。谁控制着最强大的AI模型,谁拥有训练数据能力,谁决定AI的价值观和知识边界,谁就是“AI领主”。这些“AI领主”将拥有前所未有的、塑造集体认知的权力。他们可以不费吹灰之力地定义“主流知识”、边缘化异见,甚至操纵公众认知。相比过去分散的、可被辩论的学术精英,这种霸权可能更集中、更隐蔽、更难反抗。
教育体系如何帮助所有人,而非少数精英获得“驾驭AI”的能力?这是全世界人工智能协同治理的紧迫命题。
4.论文作为学术殿堂的护城河被填平了,学术堡垒坍塌了,知识平权的时代到来了,这会产生怎样的社会影响?
过去被挡在学术高墙之外的普通大众,借助AI都可能成为“业余研究者”“民间科学家”,一个没有博士学位但充满奇思妙想的工人,或一个身处资源匮乏地区但关注本地问题的牧民,也能借助AI进行严谨的文献综述、数据分析和论文撰写。任何人只要会提问,就能获取任何领域的前沿知识,甚至可以深入到细节内部。学术术语不再是壁垒,AI可以即时翻译和解释。这将大大提高全民科学素养,为公众广泛参与公共政策讨论提供强大支持。当人人都能“发表”论文时,传统的期刊价值以及其被视为期刊质量标志的影响因子、引用量等单一评价标准将失去垄断地位。我们将如何评价论文,如何评价学术期刊?
当生成一篇格式规范、论证“貌似”严谨的假论文只需几分钟时,真实、有价值的知识将被淹没在海量的AI生成垃圾中。辨别真伪的成本将空前提高,每个人都只相信自己或自己AI验证过的信息,对公共知识基础的信仰会不会被动摇?
传统学术权威,如教授、期刊、大学的声望会明显下降,当AI能模仿甚至超越他们的产出时,“凭什么信你”这个问题也许将成为经常性的发问。社会可能陷入信任危机,或者转向新的、可能更不靠谱的权威,如网红专家、某个流行的AI模型。科学共识如何维系?
知识平权不等于智慧平权。如果人们习惯于直接向AI索取答案和论文,而不经过艰苦的思考和训练,人类的批判性思维、深度理解力和创造力会不会发生代际退化?
第三个层次,对科研制度、科研成果认定的挑战
5.过去,学术论文是科学研究成果的重要体现,学术期刊是发表论文的重要载体。学术论文和学术期刊是衡量学术水平的重要依据,是获得大学文凭的主要条件。AI成为第一作者之后,这一切都可能被“看淡了”,这对科学研究制度,对学术评价制度将产生怎样的影响?
长期建立起来的学术、文凭制度的假设是,“能写出好论文的人就是好的学者”,但AI打破了这个假设。当AI能写出比大多数研究生更好的论文时,基于“提交几篇合格论文”的学位授予制度将受到致命冲击。
期刊不再是“知识认证中心”,也不再是学术共同体的最重要的纽带。
这样的改变会不会导致科学研究的核心目标,从“生产更多论文”变为“建立对世界更可靠的信念”;学术评价的核心,会不会从衡量产出数量变为评估“信任价值”?
过去评价的是静态的论文产品,将来大概率会转向评价动态的、可复现的研究全过程。评价对象不仅是论文本身,而且包括AI使用声明的完整性与透明度,要求详细记录提示词、模型版本、人类修改痕迹等;人类贡献的实质性与关键性内容,比如在问题构思、数据诠释、结论升华中到底起了什么作用;研究过程的“可复现性”——包括原始数据、全部代码、AI交互日志、验证脚本等,将成为重要条件。
文凭可能被AI协作实战能力所替代,或者这两者要求兼而有之。如在一个真实研究项目中,学生如何利用AI解决问题、如何规避AI风险、如何提出AI想不到的洞见,将成为必要的考核内容。学生口头答辩与质询的能力,在面对人类专家的深度盘问中,能否为自己的AI辅助研究结论辩护,能否识别AI的错误一定会成为必要能力。
学术期刊选用论文的重点也许不再是评判论文观点是否正确,而是审计整个研究过程是否规范、透明、可复现;区块链等技术也许会被运用到论文的甄别过程中来,为AI与人类协作的每一步提供不可篡改的时间戳和归属记录;在海量AI生成内容中,通过高质量同行评议,筛选和推荐那些“人类-AI”协作典范、具有重大理论突破或现实意义的少数成果。取代期刊地位的也许是一套动态、开放、可追溯的学术信用系统。也就是每个研究者拥有一个实时更新的画像,综合了“成功复现率、撤稿记录、数据开源度”等指标。AI本身会成为评估助理,持续监测并交叉验证。研究成果发布后,全球研究者和他们的AI可随时验证。论文也许会带上“综合可信度评分”和“详细验证报告”,取代传统的“是/否”发表。
6.将来怎样评价知识、评价人的学术贡献?
传统研究遵循“提出假设→研究设计→收集数据→验证结论”的线性模式。AI作为一作,能通过海量数据挖掘,直接输出“强相关性”或“潜在模式”,研究可能转变为“数据挖掘→发现模式→寻求诠释”的新范式。这意味着,科学发现可能先于科学理解——我们知道“是什么”,但很长时间内不知道“为什么”。
过去,好问题源于学者的学识积累和直觉,未来,AI可能会主动提出大量“有潜力”的研究问题,人类的核心竞争力将从“提出问题”部分转向“选择问题”——从AI生成的千百个候选问题中,判断哪一个真正重要、新颖、有价值。
当论文不再是核心载体,期刊不再是权威认证时,一个人的学术贡献如何评价?也许将溯其本源,看其对人类认知边界究竟带来了多大增量,以及对现实世界产生了何种影响。其考核重点也许将发生如下的变化:第一,从“产出”到“问题”。学术贡献的核心不是“你发表了多少论文”,而是“你提出、解决或选择了什么问题”;第二,提问的价值。在AI能轻松回答“已知问题”的时代,提出一个好问题——一个关键、新颖、可验证的问题——本身就是顶级学术贡献;第三,判断的贡献。在海量AI生成的假设中,识别哪个值得投入资源验证,这种学术眼光的价值会远超执行验证的能力;第四,未来的“发表”也可能是持续更新的。对某个开源知识库的重要代码提交、对某个数据集的关键修正,都会被视为正式的学术贡献。
解铃还须系铃人。学历和期刊文章的价值会下降。取而代之的,可能是基于区块链的,不可篡改的“能力徽章”,动态更新的“个人知识贡献图谱”,以及由AI辅助的持续在线同行评议系统。一个人的信誉将来自他持续产出的、经过验证的贡献,而非一纸文凭。
走向哪个方向,也许不取决于AI本身,而取决于我们设计出一个怎样的新时代的社会契约、教育体系和技术规范。我们相信,当AI可以回答大多数“已知问题”时,提出一个好问题——一个AI无法轻易回答、需要真实验证、具有理论或实践意义的问题——成为稀缺能力。这需要好奇心、批判性思维和对现实世界的敏感;AI会出错、会有偏见、会产生幻觉,能够辨别AI输出的质量、交叉验证事实、识别逻辑漏洞的人,掌握着真相的钥匙;AI擅长组合已有知识,跨领域融合知识,但无中生有、灵光乍现的创造能力还在碳基生命。
第四层次,对教育制度、师生关系的挑战
7.科研起点的门槛降低了,论文价值甚至文凭价值贬值了,大学的垄断地位是不是终结了?高等教育势必进行怎样的变革?
前面我们已经提到,大学在生产和传播知识的同时,其实也在垄断知识、阻碍知识的传播。过去大学的权力,建立在对知识生产全过程的垄断之上,比如对知识资源的垄断——大学是唯一系统收藏、传授、认证高深知识的地方,不进入这个“收藏”重地,似乎就不能获得获取知识的“合法性”,被“某某大学图书馆收藏”是知识合法性的象征,被收藏大学的级别越高、名声越大,就越有价值。但现在,顶级课程免费可得,AI能按需生成个性化知识图谱,大学不再是知识的唯一入口;又比如对文凭认证的垄断——学位是进入专业阶层的硬通货。当AI能辅助产出超越普通毕业生的成果时,文凭作为“能力信号”的价值正在稀释。大学不再是能力的唯一证明;再比如对研究范式的垄断:过去科研项目依赖大学提供的平台、设备和学术共同体。现在,云端算力与AI工具使个人或小团队也能做出突破性发现,大学不再是创新的唯一摇篮。
这三种垄断的解体,意味着大学再也无法像过去那样,理所当然地成为知识、能力和精英身份的“保镖”。顺应这种变化,大学自身的变革势在必行。
8.面对未来景象,教育何为?
面对如此冲击,高等教育也许将不得不进行深刻的变革。
第一,大学功能的转变。当知识获取变得便捷,大学的核心价值将如何转向AI无法提供的人类特质?比如教给学生如何质疑、验证并最终驾驭AI产出知识的批判性思维与判断力;在真实项目中,学习与不同背景的人如何合作,以提升处理模糊、冲突和伦理困境的协作与领导力;提出AI从未想过的问题,连接看似无关的话题,产生真正有洞见的创造性与想象力;引导学生思考,进行“应该用知识做什么”,而非“如何得到知识”的价值与意义探寻,等。大学的使命也许将从知识的生产和传播转向“生产能够负责任地使用知识的人”。
第二,大学体制的创新。首先是固有学制的松动,四年制本科将不再是唯一路径。模块化、微证书、终身学习账户将成为主流。学生可以随时暂停学业去创业或实践,再带着问题回到课堂。其次是认证革命,学位将与能力徽章、项目档案、同行声誉评分等并存。一份优秀的代码库、一个被验证的AI模型、一份成功的商业计划,其价值可能超过一篇课程论文。大学从“围墙校园”变化为伴随终身的、流动的学习场所。再次是跨界融合,大学与产业、社区、研究机构的边界变得模糊。学生可能有在科技公司的“学期”,有在社会组织的“实习”,在社区工作的“实验”,所有这些经历都被大学认可并计入“学分”。
第三,大学研究导向的转型。研究不再是为了发表而进行,而是解决AI难以独立解决的、需要深度跨学科协作和现实介入的复杂问题;大学实验室将成为“可信研究过程”的审计和认证机构,为AI辅助研究提供质量背书;大学成为探索“人机最佳协作模式”的试验场,其产出不是论文,而是可推广的协作方法论和伦理规范。一句话,大学的研究导向将从“发表论文”转向“引领负责任的创新”。
第四,大学教育模式的改变。大学将从“知识传授”为核心,彻底转向“批判性思维、提问能力、信息验证、AI协作伦理”为核心。考试不允许带“小抄”,但可能允许带任何AI工具,考题会变成“请找出以下三篇AI生成论文中的逻辑谬误和数据造假痕迹”或“设计一个实验,验证一个你关心但AI无法直接回答的问题”等。
9.如果这个趋势成立,未来大学里,教授和学生最应该培养的、AI最难替代的“核心能力”是什么?
这里,我想明确提出一个概念;人机协同商数(Collaboration with Ai Quotient),简称“C商(CQ)”,与智商(IQ)和情商(EQ)并列,共同构成人工智能时代一个人的核心素养。过去我们描述一个人“会用AI”,这太笼统了。而C商将这种模糊能力转换成为可量化、可测量、可培养的核心素养。未来,一个人可能不再因“背不出知识点”而自卑,而会因“能与AI高效协作解决复杂问题”而自豪。“高C商”将成为未来人最重要的能力要素之一。大学被赋予了新的使命,大学不再垄断知识,而是成为培养“高C商”人才的核心场所。

当知识获取和常规认知任务很多被AI替代后,一个人与AI协同、互补、共进的能力,将成为衡量其学习、工作能力和生产效能的关键能力。
C商不仅仅是“会用AI工具”,人机协同能力是一个综合性的能力组合,至少包含以下几个层面,而这些恰恰可以成为未来大学入学、毕业乃至终身评价的重要维度:一是提问与任务拆解能力,核心是将模糊的、开放性的现实问题或好奇心,转化为AI可以理解、分步处理的具体指令或任务链;二是信息鉴别与批判性整合能力,核心是对AI生成的信息如文本、数据、代码,进行事实核查、逻辑检验、偏见识别和情境化评估,并能将碎片化的AI输出整合成连贯、有洞见的结论;三是结果诠释与意义赋予能力,核心是AI能输出“是什么”,但难以理解“这意味着什么”,人类需要将冰冷的计算结果,置于更广阔的社会、伦理、历史或人性语境中加以诠释;四是认知责任与伦理判断能力,核心是明确知道何时、为何、以及以何种方式对AI辅助的产出承担最终责任,并能识别和规避协同中的伦理风险;五是自我迭代与元认知能力,核心是在与AI的协作过程中,能反思自己的认知局限、AI的优缺点,并主动调整协作策略,实现“人机协同”的整体效能提升、人与机器的共同进化。
10.以前教师是知识和真理的化身,教师受到尊重,具有权威,现在知识平权了,师生关系将发生怎样的变化,应该塑造怎样的新型师生关系?
知识生产、知识传播方式的巨大变化,必然引起师生关系的变化。当教师不再是知识的单方面的拥有者,师生关系必然从“权威-服从”转向“协作-共生”。未来的教师,将不再是“知识的传授者”,而是“学习生态的架构师”和“成长旅程的向导”。师生关系也必然会重塑。一是从“单向灌输”转向“双向探索”,过去是“教师讲,学生听”,未来将是师生共同面对一个AI辅助下的复杂问题,一起设计验证路径、分析AI给出的结果、批判各自的判断。权威建立在真诚的探索态度和更强的判断力上,而非身份上;二是从“正确答案”转向“更优问题”,当AI能瞬间给出答案,教师的重点不再是评判学生对错,而是激发和筛选学生提出的问题。“你是怎么想到这个问题的?”“这个问题比上一个好在哪?”——提问的质量将成为衡量学习成效的关键;三是从“标准评价”转向“个性化引导”,AI能承担知识传授和初步练习的任务,这解放了教师,使其能聚焦于每位学生的独特思维过程、情感状态和成长需求。教师更像一个成长教练,识别学生的认知瓶颈和兴趣火花,提供精准的鼓励和挑战。
百舸争流千舟竞,波涛在后岸在前。这场实验所引发的问题,其意义已远超实验本身的结论。它们像一面多棱镜,折射出AI浪潮下人类文明在知识、权力与教育十字路口的兴奋、不安、想象与无限的可能。寻找答案的过程,将是碳基生命与硅基生命连台共舞的过程。这场激动人心的技术与人性的双向奔赴,正呼唤我们以最大的智慧与勇气,去设计新的社会契约、技术规范、科学体系和教育体系,实现人与机器的共同进化。
夜雨聆风