阳志平:如何让 AI 在你睡觉时,持续干活?

昨天，开智学堂联合旗下品牌活水智能，发布了「AI 自主系统训练营」首期内测。课程刚一上线就大受欢迎，100+ 位同学第一时间报名。

AI 自主系统究竟是什么？它为什么重要？我们又该怎么学好这门课？课程经理蒲素就这些问题采访了阳志平老师。以下是访谈实录。

Q1：在 2026 年，为什么偏偏是「AI 自主系统」？

蒲素：阳老师，这两年 AI 新进展层出不穷，大家都感觉 AI 越来越强。在这么多方向里，你为什么偏偏挑了「AI 自主系统」这个选题？

阳志平：我先给一个数据。2026 年的前 5 个月，我在团队内部的 Git 仓库里提交了 5060 次——比我过去 3 年加起来还多。要知道，自 2015 年起，我就很少亲自下场写代码，一直在带团队。

更关键的是，这 5060 次提交，几乎全是 AI 替我完成的。那种你不在电脑前、甚至在睡觉时，AI 依然在勤勤恳恳替你干活的感觉，只要体验过一次，你就再也回不到从前了。

业界给这种现象起了不少名字，最流行的是「harness」，但我觉得这个词远不够准确。所以我自己造了一个词：AI 自主系统（Autonomous AI System）——指的就是这一整套让 AI 能持续工作的机制。

在我看来，衡量 AI 发展到了什么水准，就看一件事：在没有任何人类介入的前提下，它能独立工作多久、能不能交付高质量的成果。

Q2：为什么 AI 越强，我们反而越累？

蒲素：阳老师，有位同学很期待这门课，他跟我们说，用了 AI 之后人反而更累了，期待这门新课能有助于他。你怎么看？

阳志平：这条反馈我印象很深，几乎说出了很多人的心声。他说——「AI 能干的事越来越多，人却越来越累。工作和生活的边界越来越模糊；发个问题给 AI，十来分钟才回，为了填这段时间就开多线程，甚至开好几个项目，注意力来回切换反而更累；它再一口气回我一大段文字，我都有点认知过载，读不进去了。」

这种感受越来越普遍。我在不同平台上至少刷到过七八条类似的感叹。这也是我想开这门课的原因之一——AI 自主系统要解决的，从来不只是「让 AI 多干活」，还有几个更要紧的问题：

怎么管理 AI 和人的认知负荷——既让 AI 的上下文装得下，也让人的工作记忆扛得住？

怎么让人的「碳基作息表」和 AI 的「硅基作息表」更好地协同？
什么任务必须你亲自介入，什么任务可以大胆交给 AI？
怎么不让越来越强的 AI，反而削弱人本来的意义感和自主感？

这些问题，在今天变得格外重要。这门课上，我会和大家分享、探讨我的一些初步思考。

Q3：能举个具体的例子吗？

蒲素：能不能举几个好理解的例子，让大家直观感受一下，AI 自主系统跑起来是什么样？

阳志平：对工程师来说，这个概念其实并不陌生——自动修 bug、自动评审并合并 PR、自动处理 issue，都是 AI 自主系统在干活。

我举个例子。有一次课程答疑，我当场演示 AI 怎么自主干活：8 分钟，它就实现了开智学堂学习系统的评论区时间排序功能。我没做任何干预，只打了十来个字、发了一张截图，它就干完了。

再举个例子。今年春节前，开智学堂的学习系统要上线新版，我用大约三个小时，就把核心代码从一种编程语言（Elixir）迁移到了另一种（TypeScript）；不到一周，整个新系统就上线了——背后其实都是 AI 自主系统在替我工作。

Q4：这套东西，只对工程师有用吗？

蒲素：听起来它很适合写代码。除了工程师，普通知识工作者也用得上吗？

阳志平：恰恰相反，它适用于一切知识工作。比如科研——今年 3 月，《自然》发表了一篇关于「The AI Scientist」系统的论文，讲的就是 AI 自动设计实验、自动写论文、自动审稿。参见：https://www.nature.com/articles/s41586-026-10265-5

但真正的难点也在这里：很多知识工作和编程不一样。编程有 Git、issue、PR、CI 这套成熟的自动化工作流，连 Rust、TypeScript 这类强类型语言，本身也在替 AI 自主编程把关、提升质量。可写作、咨询、管理这类工作，并没有现成的「CI」。

所以，怎么把 AI 自主编程领域已经跑通的经验，迁移到更多知识工作上去——这才是真正的难点，也是这门课我最想和大家探讨的：

Q5：搭建一套 AI 自主系统，门槛在哪？

蒲素：如果有同学想自己搭一套 AI 自主系统，门槛高吗？

阳志平：今天来看，门槛确实有，分技术和认知两层。先说技术门槛，大概四条：

一是 Git 服务器——有内部的，或者用 CNB、GitHub 这类；

二是 CI 环境——这一条最难。软件项目有成熟的 CI 标准，但怎么让写作、咨询、管理这类非技术的知识工作也具备「CI」，正是我带队在攻的难点，部分成果可以参见 42plugin（https://42plugin.com）、42md（https://42plugin.com）；

三是至少订阅两个旗舰级的国际前沿大模型，而且分属不同的两家公司；

四是比较熟悉 Claude Code 的工作原理——知道怎么针对自己的工作流，灵活组合 skill、agent、hook、command。

达到这些门槛之后，AI 自主系统差不多能连续工作 90 分钟到 3 小时，相当于一个传统团队 3 到 10 天的工作量。

但比技术门槛更高的，是认知门槛。人有人的节奏：要吃饭、要睡觉，注意力有限；AI 有 AI 的节奏：能持续运行，但上下文也会被塞满。当这两套节奏一起工作，真正的难题是——怎么让 AI 在你离线时继续推进，又不在你回来时甩给你一堆「需要重新理解」的负担？

AI 自主系统要解决的就是这件事：让你和 AI 各按各的节奏工作，但结果始终在同一个系统里对齐。这里面有不少新概念，其中我特别强调的「元反思」，就是课程的重心之一。参见：让 AI 变得更聪明的 12 个元反思技巧

Q6：有没有立即能上手的技巧？

蒲素：能不能给同学们一两个立即能用的技巧？

阳志平：我自己跑一个复杂任务，大致是这样：简单的活直接干；复杂的活先写计划、再对计划做一次「元反思」评审；干完跑端到端测试，确保功能真的成了；提交前先自审一遍；然后——这一步是精髓——让两个国际前沿大模型交叉评审，一个负责干、一个负责挑刺。外面再套上「看门狗」「意外处理」和「状态持久化」，让它中途出岔子也能自己兜住。

如果你是新手，最该先学会的就是这一招：让两个前沿大模型交叉评审。不同模型的训练倾向不同，互相挑刺，能大幅提高产出质量。

而最简单、最快能上手的，是看门狗。提示词可以这样写：

请用 CronCreate 工具帮我创建一个看门狗，读取 memory 文件（或你记录工作进展的那个文件），找到下一个未完成的步骤，立即执行。不要问我任何问题，直接做下一步。

这样，哪怕你去睡觉，它也会一步步把活往下推。类似的还有「心跳监控」：让它定时读 memory 文件，有待办就立即执行，没有就回一句 HEARTBEAT_OK。

一起来，设计你的 AI 自主系统

「AI 自主系统训练营」首期内测，共 6 讲，从导论、关键方法论，到编程、科研、营销、健康四大实战场景。课程由阳志平老师教研指导并主讲关键章节，趋静、下山雨、蒲素三位老师共同主讲应用章节。用 42 天，从零搭建一套属于你的 AI 自主系统。

让 AI 从答完一句就停，变成持续替你推进任务的聪明同事。■

首发特惠！72 小时有效，先到先得！首发特惠！72 小时有效，先到先得！

首发特惠！72 小时有效，先到先得！

↙首发特惠，72 小时有效，先到先得！