读 Anthropic《When AI builds itself》:当AI能批量生成方案,学校真正缺的是什么?

近日，Anthropic Institute 发布文章《When AI builds itself: Our progress toward recursive self-improvement, and its implications》，介绍AI参与代码编写、实验执行和工具开发后，其内部工作方式发生的变化。

Anthropic明确表示，完整的递归自我改进尚未实现，也并非必然发生。对教育而言，这篇文章更值得关注的，是AI进入组织工作流之后带来的现实变化。

从早期由人编写代码，到聊天机器人提供局部帮助，再到智能体独立编辑代码、运行任务，AI参与研发的范围正在扩大。人的工作重心则逐渐转向目标设定、审核、判断和协调。

截至2026年5月，Anthropic称其自身代码库中超过80%的合并代码由Claude编写。2026年第二季度，典型工程师每天合并的代码量约为2024年的8倍。

这些是Anthropic披露的内部数据，尚未经过独立第三方验证，代码数量也不能直接等同于生产力。

但产出速度提升以后，新的限制已经出现：AI生成代码的速度可能超过人的审核速度，借助AI产生的新工具、新项目和新想法，也超过了组织能够继续推进的数量。

当执行变得更便宜、更快速，组织的瓶颈便可能从“生产不出来”，转向“消化不了这么多”。

类似的变化，也值得放到教育现场中观察。

01 学校正在获得越来越多方案

过去，完成一份教学方案需要投入不少时间。教师要查找资料、梳理目标、设计活动、制作课件，还要准备作业和评价工具。

现在，教师可以在较短时间内生成多套教案、课堂活动、分层作业和评价量规。学校开展AI教育实践时，也更容易形成项目构想、培训框架和实施初稿。

这降低了教学创意从想法走向初稿的门槛。原本来不及整理的构思，可以先由AI协助展开；一份方案不够理想，也可以迅速生成多个版本进行比较。

方案数量增加以后，新的问题随之出现。

一位教师可以得到三套不同的教学设计，但一节课只能选择其中一套实施。一个备课组可以列出多种AI应用方式，但教师用于共同讨论、听课观察和课后复盘的时间并不会同步增加。

AI提高了方案生产能力，却没有同步增加教师的时间、学生的注意力和真实课堂中的实践机会。

当方案越来越容易获得，如何判断哪些方案值得继续尝试，也会变得更加重要。

02 方案变多，不等于课堂改变更快

AI生成的教学方案通常可以很完整：有目标、有流程、有活动、有评价，也有预期成果。

这种完整性容易让人忽略，从方案成形到课堂发生变化，中间还隔着实际使用和持续观察。

AI可以迅速生成一套分层作业，但这些题目是否真正对应本班学生的困难，要在使用中才能看出来。AI也可以设计一项课堂活动，但它能否促进学生理解，而不只是增加课堂形式，同样需要结合学生表现进行判断。

一份方案可以在几分钟内生成，它的实际价值却只能在真实使用中逐步显现。

如果方案增长速度超过学校的实践能力，可能出现一种情况：同时开展的尝试越来越多，但每项实践获得的观察、讨论和改进时间却越来越少。

生成可以回答“还可以怎样设计”，实践需要进一步回答“这样的设计产生了什么变化”。

03 新的限制，出现在实施、验证和取舍中

Anthropic在文章中提到，当AI能够快速执行实验以后，问题会逐渐转向：哪些实验值得开展，哪些结果值得信任，哪些路径已经不适合继续投入。

学校与AI企业的工作目标和运行方式并不相同，不能作简单类比。但这一变化仍然提供了一个观察角度：当方案生产速度提升，未被同步加速的环节更容易成为新的限制条件。

首先是实施机会。一次课堂尝试会占用教师和学生真实的时间，不可能像生成文本一样不断复制。

其次是效果验证。没有学生表现、作品变化和课堂反馈，便很难区分“方案看起来完整”和“方案确实回应了教学问题”。

此外，不同方案之间还需要取舍。如果同时推进的尝试过多，有限的教研时间和支持资源可能被分散，每项实践也更难获得持续观察。

随着方案越来越多，筛选、试验、验证，以及判断是否继续、调整或暂停的重要性也在上升。

学校面对的变化，可能已经不只是如何获得更多AI方案，还包括如何识别少数值得深入观察的方向。

04 一个有限场景，更容易看见实际变化

面对不断增加的AI工具和方案，一些范围较小、问题明确的实践，往往更容易看清AI究竟产生了什么作用。

例如，一个备课组发现，学生完成探究任务后，报告中经常只有结论，缺少证据和推理过程。教师由此尝试让AI根据既定评价标准提出问题，帮助学生发现论证缺口，但不直接改写报告。

在这样的场景中，AI只参与一个具体环节，观察范围也相对清楚：学生修改前后的文本发生了什么变化？补充的证据是否更充分？AI反馈是否指向了真实的学习困难？教师审核这些反馈是否增加了额外工作？

这些信息未必能立即证明一种做法可以推广，却能帮助教师更具体地理解它的作用和边界。

一个经历了实施、观察和复盘的小案例，通常比一批尚未进入课堂的完整方案更有积累价值。

重要的并不是把这个案例当作固定流程，而是让方案接受真实课堂的检验。

05 有价值的成果，不只是一份展示材料

一项AI教学实践完成后，学校通常会留下教案、课件、活动照片和新闻稿。这些材料记录了项目发生过，却未必能帮助下一位教师继续使用。

更值得沉淀的，是实践中形成的判断和方法。

哪些学习问题适合由AI辅助？AI实际参与了哪个环节？教师怎样核验生成内容？学生保留了哪些独立完成的过程？这些问题比单独保存一份最终教案更能呈现实践的真实经验。

相关经验还可以被整理为任务模板、评价量规、提示词或操作记录。其他教师再次尝试时，便可以参考已有实践，而不必重新从生成一份方案开始。

值得保留下来的，不只是AI生成过什么，还有哪些做法经过了实践、产生了怎样的变化，以及它们受到哪些条件限制。

这类经验未必能够直接复制，却可以成为下一次实践更可靠的起点。

06 当生成变容易，吸收能力更值得关注

Anthropic的文章讨论的是AI研发组织，不能直接用来解释学校教育。但它所呈现的“瓶颈转移”，为观察学校的AI实践提供了一个新角度。

当教案、课件、活动和项目方案可以批量生成，实施、验证、复盘和经验沉淀的重要性会更加突出。

观察学校的AI实践时，除了项目和资源的数量，还可以关注一些更接近教育现场的问题：它回应了什么具体问题？进入课堂后发生了什么？留下了哪些证据？形成的经验能否支持后续改进？

当方案可以批量生成，提出更多想法可能不再是最难的部分。更难的是把有限的好想法带入课堂，并在真实反馈中不断完善。

未来，实践之间的差异，可能不只体现在谁生成得更多、更快，也体现在谁能够持续观察方案进入课堂后的变化，并把有效经验保留下来。

少谈AI生成了多少，多看教育改变了什么。

* 来源机构：Anthropic Institute

* 文章名称：《When AI builds itself: Our progress toward recursive self-improvement, and its implications》

* 发布时间：2026年6月4日

* 原始链接：https://www.anthropic.com/institute/recursive-self-improvement

* 文件性质：Anthropic基于公开基准与内部数据发布的研究和趋势文章

* 事实边界：相关内部数据为机构自报，文章讨论的是可能的发展情景，并未声称完整的递归自我改进已经实现；企业内部的代码与实验数据也不能直接等同于学校教育实践。

* 配图说明：文章部分原始图片来自Anthropic公开文章，其余配图由AI辅助生成，仅作辅助呈现

🎁 AI 教育前沿资料库

为了方便大家进一步阅读原始材料，我整理了一份《AI教育前沿资料库》。

资料库汇集国内外AI教育领域的政策文件、研究报告、指南工具和标准规范，并标注发布时间、来源机构、国家地区和资料类别，方便检索与查阅。资料库将持续补充和更新，适合关注AI教育趋势、教师实践和学校治理的读者长期查阅。

获取方式：只需在本公众号后台回复关键词：AI资料库，即可获取资料库查看链接。

如果这篇文章对您有启发，欢迎点赞、转发、在看、评论。您的支持，是我们持续整理AI教育前沿资料、分享教师实践观察的动力。