
近日,Anthropic Institute 发布文章《When AI builds itself: Our progress toward recursive self-improvement, and its implications》,介绍AI参与代码编写、实验执行和工具开发后,其内部工作方式发生的变化。
Anthropic明确表示,完整的递归自我改进尚未实现,也并非必然发生。对教育而言,这篇文章更值得关注的,是AI进入组织工作流之后带来的现实变化。
从早期由人编写代码,到聊天机器人提供局部帮助,再到智能体独立编辑代码、运行任务,AI参与研发的范围正在扩大。人的工作重心则逐渐转向目标设定、审核、判断和协调。

截至2026年5月,Anthropic称其自身代码库中超过80%的合并代码由Claude编写。2026年第二季度,典型工程师每天合并的代码量约为2024年的8倍。

这些是Anthropic披露的内部数据,尚未经过独立第三方验证,代码数量也不能直接等同于生产力。
但产出速度提升以后,新的限制已经出现:AI生成代码的速度可能超过人的审核速度,借助AI产生的新工具、新项目和新想法,也超过了组织能够继续推进的数量。
当执行变得更便宜、更快速,组织的瓶颈便可能从“生产不出来”,转向“消化不了这么多”。

类似的变化,也值得放到教育现场中观察。
01 学校正在获得越来越多方案
过去,完成一份教学方案需要投入不少时间。教师要查找资料、梳理目标、设计活动、制作课件,还要准备作业和评价工具。
现在,教师可以在较短时间内生成多套教案、课堂活动、分层作业和评价量规。学校开展AI教育实践时,也更容易形成项目构想、培训框架和实施初稿。
这降低了教学创意从想法走向初稿的门槛。原本来不及整理的构思,可以先由AI协助展开;一份方案不够理想,也可以迅速生成多个版本进行比较。
方案数量增加以后,新的问题随之出现。
一位教师可以得到三套不同的教学设计,但一节课只能选择其中一套实施。一个备课组可以列出多种AI应用方式,但教师用于共同讨论、听课观察和课后复盘的时间并不会同步增加。

AI提高了方案生产能力,却没有同步增加教师的时间、学生的注意力和真实课堂中的实践机会。
当方案越来越容易获得,如何判断哪些方案值得继续尝试,也会变得更加重要。
02 方案变多,不等于课堂改变更快
AI生成的教学方案通常可以很完整:有目标、有流程、有活动、有评价,也有预期成果。
这种完整性容易让人忽略,从方案成形到课堂发生变化,中间还隔着实际使用和持续观察。

AI可以迅速生成一套分层作业,但这些题目是否真正对应本班学生的困难,要在使用中才能看出来。AI也可以设计一项课堂活动,但它能否促进学生理解,而不只是增加课堂形式,同样需要结合学生表现进行判断。
一份方案可以在几分钟内生成,它的实际价值却只能在真实使用中逐步显现。
如果方案增长速度超过学校的实践能力,可能出现一种情况:同时开展的尝试越来越多,但每项实践获得的观察、讨论和改进时间却越来越少。
生成可以回答“还可以怎样设计”,实践需要进一步回答“这样的设计产生了什么变化”。
03 新的限制,出现在实施、验证和取舍中
Anthropic在文章中提到,当AI能够快速执行实验以后,问题会逐渐转向:哪些实验值得开展,哪些结果值得信任,哪些路径已经不适合继续投入。
学校与AI企业的工作目标和运行方式并不相同,不能作简单类比。但这一变化仍然提供了一个观察角度:当方案生产速度提升,未被同步加速的环节更容易成为新的限制条件。
首先是实施机会。一次课堂尝试会占用教师和学生真实的时间,不可能像生成文本一样不断复制。
其次是效果验证。没有学生表现、作品变化和课堂反馈,便很难区分“方案看起来完整”和“方案确实回应了教学问题”。
此外,不同方案之间还需要取舍。如果同时推进的尝试过多,有限的教研时间和支持资源可能被分散,每项实践也更难获得持续观察。

随着方案越来越多,筛选、试验、验证,以及判断是否继续、调整或暂停的重要性也在上升。
学校面对的变化,可能已经不只是如何获得更多AI方案,还包括如何识别少数值得深入观察的方向。
04 一个有限场景,更容易看见实际变化
面对不断增加的AI工具和方案,一些范围较小、问题明确的实践,往往更容易看清AI究竟产生了什么作用。
例如,一个备课组发现,学生完成探究任务后,报告中经常只有结论,缺少证据和推理过程。教师由此尝试让AI根据既定评价标准提出问题,帮助学生发现论证缺口,但不直接改写报告。

在这样的场景中,AI只参与一个具体环节,观察范围也相对清楚:学生修改前后的文本发生了什么变化?补充的证据是否更充分?AI反馈是否指向了真实的学习困难?教师审核这些反馈是否增加了额外工作?
这些信息未必能立即证明一种做法可以推广,却能帮助教师更具体地理解它的作用和边界。
一个经历了实施、观察和复盘的小案例,通常比一批尚未进入课堂的完整方案更有积累价值。
重要的并不是把这个案例当作固定流程,而是让方案接受真实课堂的检验。
05 有价值的成果,不只是一份展示材料
一项AI教学实践完成后,学校通常会留下教案、课件、活动照片和新闻稿。这些材料记录了项目发生过,却未必能帮助下一位教师继续使用。
更值得沉淀的,是实践中形成的判断和方法。
哪些学习问题适合由AI辅助?AI实际参与了哪个环节?教师怎样核验生成内容?学生保留了哪些独立完成的过程?这些问题比单独保存一份最终教案更能呈现实践的真实经验。
相关经验还可以被整理为任务模板、评价量规、提示词或操作记录。其他教师再次尝试时,便可以参考已有实践,而不必重新从生成一份方案开始。
值得保留下来的,不只是AI生成过什么,还有哪些做法经过了实践、产生了怎样的变化,以及它们受到哪些条件限制。
这类经验未必能够直接复制,却可以成为下一次实践更可靠的起点。

06 当生成变容易,吸收能力更值得关注
Anthropic的文章讨论的是AI研发组织,不能直接用来解释学校教育。但它所呈现的“瓶颈转移”,为观察学校的AI实践提供了一个新角度。
当教案、课件、活动和项目方案可以批量生成,实施、验证、复盘和经验沉淀的重要性会更加突出。
观察学校的AI实践时,除了项目和资源的数量,还可以关注一些更接近教育现场的问题:它回应了什么具体问题?进入课堂后发生了什么?留下了哪些证据?形成的经验能否支持后续改进?
当方案可以批量生成,提出更多想法可能不再是最难的部分。更难的是把有限的好想法带入课堂,并在真实反馈中不断完善。
未来,实践之间的差异,可能不只体现在谁生成得更多、更快,也体现在谁能够持续观察方案进入课堂后的变化,并把有效经验保留下来。
少谈AI生成了多少,多看教育改变了什么。

* 来源机构:Anthropic Institute
* 文章名称:《When AI builds itself: Our progress toward recursive self-improvement, and its implications》
* 发布时间:2026年6月4日
* 原始链接:https://www.anthropic.com/institute/recursive-self-improvement
* 文件性质:Anthropic基于公开基准与内部数据发布的研究和趋势文章
* 事实边界:相关内部数据为机构自报,文章讨论的是可能的发展情景,并未声称完整的递归自我改进已经实现;企业内部的代码与实验数据也不能直接等同于学校教育实践。
* 配图说明:文章部分原始图片来自Anthropic公开文章,其余配图由AI辅助生成,仅作辅助呈现

🎁 AI 教育前沿资料库
为了方便大家进一步阅读原始材料,我整理了一份 《AI教育前沿资料库》。
资料库汇集国内外AI教育领域的政策文件、研究报告、指南工具和标准规范,并标注发布时间、来源机构、国家地区和资料类别,方便检索与查阅。资料库将持续补充和更新,适合关注AI教育趋势、教师实践和学校治理的读者长期查阅。

获取方式:只需在本公众号后台回复关键词:AI资料库,即可获取资料库查看链接。
如果这篇文章对您有启发,欢迎点赞、转发、在看、评论。您的支持,是我们持续整理AI教育前沿资料、分享教师实践观察的动力。
夜雨聆风