当一个人围绕自己的兴趣,借助AI的力量,从零构建出一个完整的教育工具——这不是科幻,而是2026年正在发生的事。

打开浏览器,一个交互式数学课件映入眼帘。封面页显示"一次函数"的课程标题,探索页嵌入了Desmos图形计算器,拖动滑块就能实时观察参数变化如何影响直线形态。动画页用Canvas逐步绘制函数图像,配合字幕讲解关键概念。练习页包含四道覆盖不同Bloom认知层级的题目,从记忆到分析层层递进。整个课件流畅自然,与专业教育软件的差距远比想象中小。

再打开另一个课件——英语"颜色词汇"。紫色主题的封面页,探索页是八张翻卡,点击翻转显示英文单词、音标和例句。动画页播放颜色教学动画,每个颜色出现时自动朗读英文名称。整个课件就是一个HTML文件,不需要服务器、不需要安装、不需要网络连接,浏览器直接打开就能用。
这就是CourseLite——一个AI驱动的课件生成工具。你只需要告诉它学科和主题,比如"数学-一次函数"或"英语-颜色词汇",它就能在几分钟内生成一个完整的交互式课件。
但CourseLite真正值得讲述的,不是它的功能,而是它的诞生方式。这个项目从分析、设计、编码到调试,几乎全部由AI Agent自主完成。我的角色,仅仅是提出初始需求、审查中间结果、反馈改动意见。这种协作模式,恰好印证了Andrej Karpathy在2026年4月提出的最新判断。
2025年2月,Karpathy提出了"Vibe Coding"——氛围编程,描述了一种"完全交给氛围,忘掉代码的存在"的编程方式。这条推文获得超过450万次浏览,柯林斯词典将"vibe coding"评为2025年度词汇。但仅仅一年后,2026年4月,Karpathy在Sequoia Capital的AI Ascent活动上亲手宣布了这个概念的终结。他说,2025年12月是一个转折点——在那之前他80%的时间自己写代码,在那之后他80%的工作交给了AI Agent。"我记不清上一次手动修改代码是什么时候了,"他说,"我只是越来越信任这个系统。"[1]
Karpathy将这种新的工作方式命名为"Agentic Engineering"——智能体工程。他精确地区分了两个概念:Vibe Coding提升了所有人做软件的能力下限,Agentic Engineering则是在保持专业水准的前提下用AI获得速度提升。前者是让更多人能做软件,后者是让会做软件的人做得更快更好。他说:"你仍然对你的软件负责,和以前一样。"[1]
这个区分至关重要。Vibe Coding的核心体验是"碰运气"——你描述意图,AI生成代码,不行就再试一次。Agentic Engineering的核心体验是"指挥"——你设定目标、审查方案、把控质量,Agent负责执行。人类的角色从"写代码的人"变成了"指挥Agent写代码的人",而这本身是一门需要学习的技术。Karpathy总结道:"你可以外包你的思考,但你无法外包你的理解。"[1]
CourseLite这个项目,恰好走完了从Vibe Coding到Agentic Engineering的完整路径。它的诞生过程,本身就是AI与人类协作模式演进的鲜活样本。
从开源项目到简化方案

CourseLite的故事始于对开源项目TeachAny的深度解析。TeachAny是一个AI驱动的教学设计操作系统,内置了420多个课件、2399个知识点、覆盖14个学科,支持中国课标、AP、Cambridge、IB、US CCSS等五套课程体系。它的核心价值在于将Bloom分类法等学习科学理论嵌入课件结构,生成真正可学、可练、可反馈的互动课程。
但TeachAny的架构相当复杂。它采用双仓库设计,工作流分为五个阶段,语音合成依赖Azure TTS外部服务,视频生成依赖Remotion编程式渲染引擎,知识数据由2394个卫星文件组成,总计超过46MB。这些设计保证了专业性和完整性,但也带来了高昂的使用门槛——你需要配置Azure TTS密钥、安装Remotion依赖、理解五阶段工作流、熟悉双仓库的提交规范。
我提出了一个朴素的需求:做一个功能一样但更简单的版本。这个需求被交给了AI Agent来执行。Agent首先调用了"本质探索"技能[2],对TeachAny进行了三阶解构分析——从"是什么"到"为什么"再到"怎么做",逐层拆解项目的架构逻辑、数据模型和工作流设计。分析过程生成了多份文档:项目级主文档、Skill核心模块分析、知识层数据架构分析、课件模板结构分析,以及一份递归深入分析总结。
分析完成后,Agent提出了简化方案:双仓库合并为单仓库,五阶段工作流压缩为四步,内置教材数据改为AI动态生成,多文件输出改为单HTML文件。核心洞察是——TeachAny的复杂性主要来自"预制一切"的设计哲学,而如果信任AI的即时生成能力,大量预置数据和工作流环节都可以省略。就像做饭,TeachAny的方式是提前备好所有食材和菜谱,CourseLite的方式是告诉厨师你想吃什么,让他现场采购和烹饪。
💡 核心: 简化不是删减功能,而是换一种实现路径。TeachAny用"预制+组装"的方式保证质量,CourseLite用"按需生成"的方式追求灵活。两种路径各有适用场景,但后者显著降低了使用门槛。
四步工作流:从主题到课件

CourseLite的核心是一个四步工作流:定义→设计→构建→验证。用户只需要提供学科和主题,比如"数学-一次函数"或"英语-颜色词汇",AI就会自动完成后续所有步骤。
第一步定义课件基本信息——学科、学段、知识点。学科注册表覆盖八个学科,每个学科定义了学段范围、课型和主题色。第二步由AI根据主题自动生成教学结构,通常包含封面页、导入页、概念页、探索页、练习页、动画页和总结页。第三步模板渲染,将AI生成的内容注入HTML模板,同时激活Canvas动画引擎和Web Speech语音合成。第四步自动验证,14项检查确保课件质量达标——HTML结构完整、JSON数据有效、必填页面齐全、Bloom层级覆盖、互动工具可用。
关键设计决策是"单HTML输出"。每个课件都是独立HTML文件,零外部依赖,浏览器直接打开即可使用。不需要服务器、不需要安装、不需要网络连接(除了首次加载互动工具的CDN脚本)。

数学课件"一次函数"的探索页嵌入了Desmos图形计算器,学生可以拖动滑块实时观察参数k和b的变化如何影响直线形态。动画页用Canvas绘制坐标系,逐步展示函数图像的绘制过程。英语课件"颜色词汇"的探索页是翻卡组件,点击翻转显示英文单词、音标和例句;动画页播放颜色教学动画时自动通过Web Speech API朗读英文名称。两种课件展示了CourseLite对不同学科的适配能力——数学侧重图形交互,英语侧重语音和记忆。
人机协作的演进:从编码者到需求者

CourseLite项目最值得关注的,不是它的技术实现,而是它的诞生方式。整个项目从分析到设计到编码到调试,几乎全部由AI Agent自主完成。人类的角色,仅仅是提出初始需求、审查中间结果、反馈改动意见。这种协作模式与传统的"人写代码+AI辅助补全"截然不同,也超越了Karpathy描述的"氛围编程"。
在传统开发模式中,人类承担90%的工作——手写代码、调试错误、优化性能,AI只负责10%的语法补全和简单建议。在氛围编程中,分工比例反转——人类描述意图占40%,AI生成代码占60%,但人类仍然需要逐轮审查代码差异、粘贴错误信息、迭代修正。Karpathy自己说,这种方式下"代码会超出我的理解范围",但他仍然需要持续地与AI对话。
而在CourseLite的开发过程中,协作模式更进一步:我只需要在关键节点做决策,其余全部交给Agent。比如,当Agent完成TeachAny的深度分析后,我只需说"做一个简化版";当Agent发现Desmos需要登录才能使用预制图表链接时,我只需问"可以免登录吗";当Agent完成英语课件但缺少互动元素时,我只需指出"英语学科为什么不需要互动工具";当动画演示无法正常显示时,我只需报告"动画演示点击后无法正常显示"。
每一次我的反馈都简短而精准——不是告诉AI"怎么做",而是告诉AI"结果不对"。具体的诊断和修复完全由Agent自主完成。比如"免登录"的需求,Agent自主调研了Desmos API、GeoGebra Deploy API、PhET模拟等多种免登录方案,最终选择了Desmos API方式——使用demo key直接在页面中渲染图形计算器,无需用户登录Desmos账号。整个调研和实现过程,我只提供了"可以免登录吗"这六个字。
💡 核心: 从传统开发到氛围编程再到自动化协作,人类的角色从"编码者"变为"意图描述者"再变为"需求提出者"。每一次跃迁,人类离代码更远一步,离产品思维更近一步。
这种转变的底层驱动力是AI Agent能力的质变。2025年初,以Cursor、Replit Agent、Claude Code为代表的Agentic IDE开始具备读取代码库、规划变更、执行修改的能力,不再是简单的代码补全工具,而是能够理解项目上下文、自主决策的协作伙伴。
项目过程中有一个典型的例子:Canvas动画引擎的registerAnimation函数通过innerHTML注入的<script>标签无法执行,导致动画注册失败。这个问题是Agent自主诊断并修复的——它发现浏览器安全机制会阻止innerHTML注入的脚本执行,于是设计了_pendingAnims延迟注册机制,在页面渲染完成后统一注册所有动画实例。整个诊断和修复过程,我只提供了"动画演示点击后无法正常显示"这一条反馈。
另一个例子是语音朗读功能的集成。当我指出英语课件"读单词没有声音"时,Agent没有简单地添加一个音频播放器,而是设计了一套完整的语音系统——在动画的captions数据结构中添加speak字段,在动画循环中检测当前字幕并调用Web Speech API朗读,用_lastSpokenCaption变量防止重复朗读,在动画重新开始时重置语音状态。这套系统不仅解决了当前的问题,还成为了模板的标准能力,后续生成的所有英语课件都会自动包含语音朗读功能。
教育的个性化命题

CourseLite所指向的,不仅是一个技术工具,更是一个教育命题:在AI时代,学习应该是什么样子?
当前的教育体系仍然以标准化为核心特征——统一的教材、统一的进度、统一的考核。这种模式在工业时代有其合理性,但在信息时代越来越显得力不从心。当AI已经能够替代大量重复性工作,标准化教育的价值正在被重新审视。
2024年,中国教育部启动了人工智能赋能教育行动,推出四项具体行动,旨在用AI推动教与学融合应用,提高全民数字教育素养与技能,开发教育专用人工智能大模型。2025年3月,国家智慧教育公共服务平台2.0智能版上线,围绕"学AI、用AI、创AI、护AI"四个维度上线了一批智能化资源,让教学从"千人一面"迈向"千人千面"。
中国教育科学研究院发布的《中国智慧教育发展报告(2024—2025)》提出了智慧教育的"六新"特征:从"效率优先"迈向"适性发展"的新理念、从"碎片知识堆叠"迈向"世界模型建构"的新内容、从"符号学习"迈向"场景训练"的新方法。报告指出,"学什么"比"怎么学"更重要。
北京师范大学校长于吉红认为,随着生成式人工智能、大数据等技术快速演进,教育正在从传统的"师-生"二元结构,转向"师-机-生"三元协同的新生态。这意味着AI不再仅仅是教学工具,而是教育生态中的独立参与者——它可以是学生的"学习搭子",可以是教师的"人机协同伙伴",也可以是课程内容的"共同创造者"。
CourseLite在这个方向上提供了一个具体的技术路径。它的四步工作流意味着:任何人在任何时间,只要有一个学习主题的想法,就可以在几分钟内生成一个交互式课件。一个对恐龙着迷的小学生可以生成"恐龙百科"课件,一个想学吉他的高中生可以生成"和弦入门"课件,一个准备雅思的大学生可以生成"学术写作"课件。每个课件都是为特定学习需求量身定制的,而不是从预制库中挑选的近似匹配。

更重要的是,CourseLite的"单HTML输出"设计天然支持分享和传播。生成的课件就是一个文件,可以通过微信、邮件、U盘任意传递,接收方用浏览器打开即可使用。这种极简的传播方式,让优质学习资源的流通不再依赖平台和账号体系。一个乡村教师收到同事分享的课件,不需要注册任何账号,不需要安装任何软件,打开浏览器就能用。
在"做"中"学":从消费者到创造者

CourseLite还隐含了一个更深层的教育理念:学习的最高形式是创造。
传统的学习路径是"先学后做"——先掌握知识,再应用知识。但在AI协作的场景下,这个顺序可以倒过来:先有一个想做的事情,然后在做的过程中学习所需的知识。一个学生想给弟弟做"颜色词汇"课件,他需要了解颜色理论、英语发音、交互设计——这些知识不是通过课本学来的,而是在制作课件的过程中自然习得的。这种学习方式的动机是内在的,目标是具体的,反馈是即时的,知识是围绕项目组织起来的网络而非孤立的知识点。
这种"在做中学"的理念并不新鲜。杜威早在20世纪初就提出了"做中学"的教育哲学,皮亚杰的认知发展理论论证了儿童通过主动操作建构知识的过程,维果茨基的最近发展区理论揭示了社会协作对认知发展的推动作用。但在传统条件下,"做中学"面临一个现实困境:做一件事的技术门槛往往远高于学一件事的认知门槛。你想通过制作课件来学习,但制作课件本身就需要掌握HTML、CSS、JavaScript——这个门槛把大多数学习者挡在了门外。
AI协作打破了这层障碍。当AI能够根据自然语言描述生成完整的交互式课件时,"制作课件"的技术门槛被大幅降低。学习者不需要懂编程,只需要知道自己想做什么——而"知道自己想做什么"恰恰是学习中最有价值的部分。这也呼应了中国教育科学研究院报告中提出的"从符号学习迈向场景训练"的趋势——把真实世界"请进"课堂,把课堂"嵌入"真实世界,回归人类具身化、情境化的学习天性。

CourseLite的实践还揭示了一个有趣的现象:当人类从"编码者"转变为"需求提出者"时,他的思维方式也在发生变化。在传统开发中,思考的中心是"怎么实现"——用什么技术栈、怎么组织代码、怎么处理边界情况。而在AI协作中,思考的中心变成了"要实现什么"——课件应该包含哪些页面、交互应该怎样设计、学习目标是什么。这种从"实现思维"到"产品思维"的转变,恰恰是教育应该培养的核心能力。
Karpathy在提出Agentic Engineering时也注意到了这种转变。他说在这种编程方式中,自己的角色更像是"创意总监"——设定方向、审查结果、做出判断[1]。这种描述准确捕捉了人机协作的本质变化:人类的价值不再在于执行,而在于判断和决策。而这,恰恰是标准化教育最不擅长培养的能力。
自动化协作的边界与挑战
当然,从"氛围编程"到"自动化协作"的演进并非没有代价。CourseLite的开发过程也暴露了当前AI Agent能力的边界。
首先是理解的局限性。Agent能够分析代码结构和执行修改,但对"为什么这样设计"的理解仍然依赖显式的文档说明。在CourseLite项目中,当我问"原版TeachAny是怎么处理英语学科的"时,Agent需要重新检索源码才能回答,而不是在设计简化方案时就主动考虑英语学科的特殊需求。这说明Agent的"理解"更多是模式匹配而非深层推理——它能识别代码中的模式,但不能像人类工程师那样从设计意图出发做决策。
其次是质量的不稳定性。Agent生成的代码有时会引入微妙的bug——比如innerHTML不执行<script>标签的问题,在Web开发中广为人知,但Agent仍然犯了这种错误。CourseLite的动画功能就经历了三轮修复才完全正常工作。
第三是架构决策的保守性。Agent倾向于在已有框架内做增量修改,而不是提出根本性的架构变更。在CourseLite项目中,从TeachAny的五阶段工作流简化为四步工作流,这个决策是由我提出的,Agent只是执行了简化。如果完全依赖Agent,它可能会在五阶段框架内做优化,而不会主动提出"为什么不砍掉一个阶段"这种根本性的重构建议。
💡 核心: 当前的自动化协作模式最适合"人类定方向、AI填细节"的分工。人类负责提出"做什么"和"为什么",AI负责"怎么做"。这种分工不是固定的——随着AI能力的提升,AI能承担的决策层级会逐步上移。但在可见的未来,人类在价值判断和架构决策上的作用仍然不可替代。
从工具到生态:教育AI化的下一步
CourseLite是一个起点,而不是终点。它展示了一种可能性:AI不仅能辅助学习,还能让学习者成为教育内容的创造者。但要真正实现"人人皆可创造个性化学习体验"的愿景,还需要解决几个关键问题。
第一个问题是内容质量的保障。AI生成的课件在结构上可以做到规范——页面齐全、Bloom层级覆盖、互动工具到位——但在内容的准确性和教学的有效性上仍有差距。特别是对于数学等严谨学科,一个错误的公式或一个不准确的定义可能误导学习者。CourseLite的自动验证脚本可以检查结构完整性,但无法验证内容正确性——这仍然需要人类专家的审核。未来可能的解决方案是引入学科知识图谱作为验证基准,或者建立社区审核机制。
第二个问题是学科适配的深度。当前的CourseLite为数学和英语做了较好的适配——数学有Desmos图形计算器,英语有翻卡组件和语音朗读。但物理、化学、生物等学科需要更专业的交互工具(如PhET模拟实验、3D分子模型),历史、地理学科需要地图和时间线组件,语文学科需要书法演示和古文注释工具。这些工具的接入和适配需要更深入的教育领域知识,也需要更丰富的动画预设。
第三个问题是学习数据的闭环。当前的课件是"生成即交付"的模式——生成后无法追踪学习者的使用情况,也无法根据学习效果动态调整内容。要实现真正的个性化学习,需要建立"生成→使用→反馈→优化"的数据闭环。比如,当学习者在练习页反复答错某类题目时,课件应该能自动增加该知识点的讲解和练习。这需要在单HTML文件中嵌入轻量级的学习分析模块。
尽管存在这些挑战,CourseLite所代表的方向是清晰的:教育的未来不在于让AI替代教师,而在于让AI赋能每一个学习者,让他们能够围绕自己的兴趣、按照自己的节奏、用最适合自己的方式来学习。这不仅是技术问题,更是教育理念的问题——从"被教育"到"自教育",从"知识消费者"到"知识创造者"。
2025年,当"vibe coding"成为年度词汇时,它标记的不仅是编程方式的变革,更是人类与机器关系的重构。从手写代码到氛围编程再到自动化协作,人类正在学会一件困难的事:放手让机器去做它擅长的事,同时把精力集中在只有人类才能做的事上——提出好问题、做出好判断、创造好想法。
CourseLite的故事证明,这条路是走得通的。一个人,一个想法,一个AI Agent,就能从零构建出一个有意义的教育工具。这不是因为这个人有多厉害,而是因为AI把"从想法到产品"的距离缩短到了前所未有的程度。当创造的成本趋近于零,唯一剩下的限制就是想象力——而想象力,恰恰是人类最不缺的东西。
参考文献
[1] Andrej Karpathy. From Vibe Coding to Agentic Engineering. Sequoia Capital AI Ascent 2026, 2026年4月. https://www.youtube.com/watch?v=96jN2OCOfLs
[2] 本质探索(Essence Programming). AI驱动的知识探索与认知提炼框架. https://github.com/zh2673-git/essence-programming
[3] CourseLite. AI驱动的交互式课件生成工具. https://github.com/zh2673-git/courselite
夜雨聆风