昨天,开智学堂联合旗下品牌活水智能,发布了「AI 自主系统训练营」首期内测。课程刚一上线就大受欢迎,100+ 位同学第一时间报名。
AI 自主系统究竟是什么?它为什么重要?我们又该怎么学好这门课?课程经理蒲素就这些问题采访了阳志平老师。以下是访谈实录。
Q1:在 2026 年,为什么偏偏是「AI 自主系统」?
蒲素:阳老师,这两年 AI 新进展层出不穷,大家都感觉 AI 越来越强。在这么多方向里,你为什么偏偏挑了「AI 自主系统」这个选题?
阳志平:我先给一个数据。2026 年的前 5 个月,我在团队内部的 Git 仓库里提交了 5060 次——比我过去 3 年加起来还多。要知道,自 2015 年起,我就很少亲自下场写代码,一直在带团队。
更关键的是,这 5060 次提交,几乎全是 AI 替我完成的。那种你不在电脑前、甚至在睡觉时,AI 依然在勤勤恳恳替你干活的感觉,只要体验过一次,你就再也回不到从前了。
业界给这种现象起了不少名字,最流行的是「harness」,但我觉得这个词远不够准确。所以我自己造了一个词:AI 自主系统(Autonomous AI System)——指的就是这一整套让 AI 能持续工作的机制。
在我看来,衡量 AI 发展到了什么水准,就看一件事:在没有任何人类介入的前提下,它能独立工作多久、能不能交付高质量的成果。
Q2:为什么 AI 越强,我们反而越累?
蒲素:阳老师,有位同学很期待这门课,他跟我们说,用了 AI 之后人反而更累了,期待这门新课能有助于他。你怎么看?
阳志平:这条反馈我印象很深,几乎说出了很多人的心声。他说——「AI 能干的事越来越多,人却越来越累。工作和生活的边界越来越模糊;发个问题给 AI,十来分钟才回,为了填这段时间就开多线程,甚至开好几个项目,注意力来回切换反而更累;它再一口气回我一大段文字,我都有点认知过载,读不进去了。」
这种感受越来越普遍。我在不同平台上至少刷到过七八条类似的感叹。这也是我想开这门课的原因之一——AI 自主系统要解决的,从来不只是「让 AI 多干活」,还有几个更要紧的问题:
怎么管理 AI 和人的认知负荷——既让 AI 的上下文装得下,也让人的工作记忆扛得住?
怎么让人的「碳基作息表」和 AI 的「硅基作息表」更好地协同?
什么任务必须你亲自介入,什么任务可以大胆交给 AI?
怎么不让越来越强的 AI,反而削弱人本来的意义感和自主感?
这些问题,在今天变得格外重要。这门课上,我会和大家分享、探讨我的一些初步思考。
Q3:能举个具体的例子吗?
蒲素:能不能举几个好理解的例子,让大家直观感受一下,AI 自主系统跑起来是什么样?
阳志平:对工程师来说,这个概念其实并不陌生——自动修 bug、自动评审并合并 PR、自动处理 issue,都是 AI 自主系统在干活。
我举个例子。有一次课程答疑,我当场演示 AI 怎么自主干活:8 分钟,它就实现了开智学堂学习系统的评论区时间排序功能。我没做任何干预,只打了十来个字、发了一张截图,它就干完了。
再举个例子。今年春节前,开智学堂的学习系统要上线新版,我用大约三个小时,就把核心代码从一种编程语言(Elixir)迁移到了另一种(TypeScript);不到一周,整个新系统就上线了——背后其实都是 AI 自主系统在替我工作。
Q4:这套东西,只对工程师有用吗?
蒲素:听起来它很适合写代码。除了工程师,普通知识工作者也用得上吗?
阳志平:恰恰相反,它适用于一切知识工作。比如科研——今年 3 月,《自然》发表了一篇关于「The AI Scientist」系统的论文,讲的就是 AI 自动设计实验、自动写论文、自动审稿。参见:https://www.nature.com/articles/s41586-026-10265-5
但真正的难点也在这里:很多知识工作和编程不一样。编程有 Git、issue、PR、CI 这套成熟的自动化工作流,连 Rust、TypeScript 这类强类型语言,本身也在替 AI 自主编程把关、提升质量。可写作、咨询、管理这类工作,并没有现成的「CI」。
所以,怎么把 AI 自主编程领域已经跑通的经验,迁移到更多知识工作上去——这才是真正的难点,也是这门课我最想和大家探讨的:

Q5:搭建一套 AI 自主系统,门槛在哪?
蒲素:如果有同学想自己搭一套 AI 自主系统,门槛高吗?
阳志平:今天来看,门槛确实有,分技术和认知两层。先说技术门槛,大概四条:
一是 Git 服务器——有内部的,或者用 CNB、GitHub 这类;
二是 CI 环境——这一条最难。软件项目有成熟的 CI 标准,但怎么让写作、咨询、管理这类非技术的知识工作也具备「CI」,正是我带队在攻的难点,部分成果可以参见 42plugin(https://42plugin.com)、42md(https://42plugin.com);
三是至少订阅两个旗舰级的国际前沿大模型,而且分属不同的两家公司;
四是比较熟悉 Claude Code 的工作原理——知道怎么针对自己的工作流,灵活组合 skill、agent、hook、command。
达到这些门槛之后,AI 自主系统差不多能连续工作 90 分钟到 3 小时,相当于一个传统团队 3 到 10 天的工作量。
但比技术门槛更高的,是认知门槛。人有人的节奏:要吃饭、要睡觉,注意力有限;AI 有 AI 的节奏:能持续运行,但上下文也会被塞满。当这两套节奏一起工作,真正的难题是——怎么让 AI 在你离线时继续推进,又不在你回来时甩给你一堆「需要重新理解」的负担?
AI 自主系统要解决的就是这件事:让你和 AI 各按各的节奏工作,但结果始终在同一个系统里对齐。这里面有不少新概念,其中我特别强调的「元反思」,就是课程的重心之一。参见: 让 AI 变得更聪明的 12 个元反思技巧
Q6:有没有立即能上手的技巧?
蒲素:能不能给同学们一两个立即能用的技巧?
阳志平:我自己跑一个复杂任务,大致是这样:简单的活直接干;复杂的活先写计划、再对计划做一次「元反思」评审;干完跑端到端测试,确保功能真的成了;提交前先自审一遍;然后——这一步是精髓——让两个国际前沿大模型交叉评审,一个负责干、一个负责挑刺。外面再套上「看门狗」「意外处理」和「状态持久化」,让它中途出岔子也能自己兜住。
如果你是新手,最该先学会的就是这一招:让两个前沿大模型交叉评审。不同模型的训练倾向不同,互相挑刺,能大幅提高产出质量。
而最简单、最快能上手的,是看门狗。提示词可以这样写:
请用 CronCreate 工具帮我创建一个看门狗,读取 memory 文件(或你记录工作进展的那个文件),找到下一个未完成的步骤,立即执行。不要问我任何问题,直接做下一步。
这样,哪怕你去睡觉,它也会一步步把活往下推。类似的还有「心跳监控」:让它定时读 memory 文件,有待办就立即执行,没有就回一句 HEARTBEAT_OK。
一起来,设计你的 AI 自主系统
「AI 自主系统训练营」首期内测,共 6 讲,从导论、关键方法论,到编程、科研、营销、健康四大实战场景。课程由阳志平老师教研指导并主讲关键章节,趋静、下山雨、蒲素三位老师共同主讲应用章节。用 42 天,从零搭建一套属于你的 AI 自主系统。
让 AI 从答完一句就停,变成持续替你推进任务的聪明同事。■


夜雨聆风