给 AI 戴上六顶思考帽
我经常会在面试时问候选人:你平时用 Claude Code 或 Codex,最长会连续跑多久?
没用过的,或者少于一个小时的,我会默默给他减分。因为在我看来,能让 AI 来帮助自己完成长时间的任务,现在已经是必不可少的一项技能了。
我自己经常在想也是:能不能用我尽可能少的指令和次数的输入,能得到 AI 更长时间的高质量输出?
这里有两个关键词,一个是「长时间」,另一个是:01
高质量
长时间其实不太难,用类似 ralph loop 的方式就能轻松做到。但高质量就没那么简单了,这好比强化学习中需要一个 Reward Model:模型能力再强,需要有靠谱的、无幻觉的奖励信号告诉它「什么算好」。
所以我现在的做法是:在给 AI 下指令之前,会先把「如何检验任务是否完成」这个条件好不小的时间准备好。
验证先行,且裁判和运动员尽可能隔离。然后就可以让 AI 在反复的迭代中,逼近目标。

这也属于是某种形式的 Harness 了:目标定义 + 验证接口 + 迭代协议 + 安全护栏,组合在一起后,就可能让 Agent 能连续跑几个小时甚至几天。
02
初版方案
我想,我应该把这个方案让更多人可以更简单的方式就能用上,从而轻松让自己的 AI 工作数小时之久,且能保证质量。
于是在跟 Claude Code 讨论了好几轮之后,得到了一份初版方案文档。
这个文档一共有 300 多行,把我喂它的两篇 Anthropic 博客的核心发现也梳理了一遍,对照了自己的工作流,还设计了一个 /harness Skill 的完整框架。

但说实话,这只是个比较初级的版本。它跟我自己的项目业务耦合得还是太紧了,同团队的人都不一定好用,更别说分享给其他人了。而且我看下来,里面也还是有不少欠考虑的地方。
于是我想把这个思路给团队的同学们 share 和讨论一下,听听他们的诉求和反馈,看能不能做得更通用一些。
03
交接 VS 协作
我之前做过一个叫 cc-go-on 的开源项目,能把 Claude Code 的会话加密导出,让别人不只是 show me the markdown,还能是 show me the prompt 来更好地了解和 AI 协作的过程。
但说实话,cc-go-on 主要还是用来做干了一半的工作交接,查看、修改和协作方面,还是太欠缺了。
而上面说的事儿,大约是我月初时候的想法了。

正好这个周末有点时间,我想着要不再往前推一步。但用什么方式能和其他人更好地协作呢?怎么让 AI 能从不同的视角和出发点来 review、给我指指点点呢?
当然可以用各种 spec 工具,也可以搞一个 AI 团队来做这件事。但我个人习惯用的,还有一个比较重要的方法,叫做「六顶思考帽」。
04
六顶思考帽
这是 Edward de Bono 在 1985 年提出的思维方法:
六种颜色的「帽子」代表六种思维角色,强迫自己从完全不同的角度审视同一个问题。

白色看事实,红色看直觉,黑色挑毛病,黄色找价值,绿色想替代方案,蓝色负责主持收尾。
几年前,对于许多靠谱或不靠谱的想法,我都会用六顶思考帽进行分析,能让我对事情的判断更全面一些,只是……每次都分析一轮还挺费脑子的。
而现在都有 AI 了,那我显然更可以让 AI 来啊:
我需要 6 个 AI「同事」,各戴一顶帽子,同时看同一份草稿,然后各自输出判断,然后还可以喊人过来一起协作。
05
Moxt
我让 Claude Code 帮我来调研 AI 协作产品。我想的是,如果没有人把这事做好,那不行,或许我可以自己用一个周末来撸上一个。
不过我显然是高估了自己的创意,Claude Code 给了我一些项目和推荐理由,我分别点开看了下,最终锁定了一个叫 Moxt 的产品:

Moxt 我有些印象,我记得在 X 上刷到过。Claude Code 对它的介绍是「The Agent-Native Workspace」,核心卖点是 AI Teammates:
你可以在一个工作空间里创建多个 AI 同事,每个有自己的名字、头像、角色定义、记忆,还有共享的文件空间。

而要说我为什么最终选了它……一开始也许,只是因为颜值吧。
而且它的 UI 和 UX 很能给我一种舒服感,完全不像我自己用 AI 整出来的钢铁 UI。当然最吸引我的,是「AI Teammates 共享 Team Space」这个设定,完全符合我的场景需求。
如果 6 个 AI 同事能共享同一份文件,那我只需要:
把草稿扔到共享空间 → 6 顶帽子各自去读 → 各自写评审 → 最好它们还能互相看对方写了什么。
06
搭舞台
在 Moxt 里创建 AI Teammate 的流程很简单:填个名字,写句描述,点 Create。

其中有一个细节是:每个 Teammate 创建后会自动做一轮 onboarding,去读工作空间里的 AGENTS.md(角色说明文件),然后主动问我「你希望我怎么沟通?我能做什么?」
像新员工入职先问几个问题,而不是冷启动给一个空白聊天框。
我一共创建了 6 个 Teammate,分别叫蓝帽、白帽、红帽、黑帽、黄帽、绿帽。
Moxt 自动给每个配了跟角色气质匹配的 emoji 头像:红帽是激情红脸,黑帽是严肃暗绿脸,黄帽竖着大拇指。

接下来,我把 harness_draft.md 上传到了 Team Space,让所有帽子 Agent 们都能读到这份草稿。
然后我给每顶帽子发了一份角色 brief。以蓝帽举例,发的是这样的:
“ 你是六顶思考帽中的蓝帽,负责流程主持和综合。先读 harness_draft.md,写一份评审议程,列出关键问题和发言顺序。等其他 5 顶帽子交了反馈后,写最终综合报告。所有内容用中文,输出到 Team Space。
每顶帽子收到 brief 后做的第一件事,都是去读 AGENTS.md,然后把自己的角色定义追加上去。
07
并行开工
蓝帽做为主持大局的人,它先是读了一遍草稿,然后写了一份《评审议程》:5 个关键问题、5 个争议点,以及其他帽子的发言顺序。

然后,其他的 5 顶帽子同时启动了。
而且是真的同时跑:6 个 chat 各跑各的,互不阻塞。并且 Moxt 里的 6 个 Teammate 各有各的聊天历史,各有各的角色记忆。

这里更为重要的一点是:它们通过共享的 Team Space 文件来协作。
草稿就放在共享空间里,所有帽子都能读到。而它们写的评审输出也都回到共享空间,别的帽子同样看得到。
08
扎心的反馈
6 顶帽子最终交了 7 份文档(蓝帽出了两份:开头的议程和最后的综合)。全文太长了不适合人类阅读(适合 AI),有几个印象深刻的点:
红帽(直觉)的第一反应:
“ 我有一种「给还没出生的孩子写育儿手册」的感觉。所有东西都完整、工整,但我不确定它是从真实的疼痛里长出来的,还是从理论推演里画出来的。

这句话属于还是,有点扎心了……
黑帽(风险)挑了个结构性的逻辑漏洞:
它发现我的草稿自己花了大量篇幅论证「模型自评会系统性偏高」,转头又在方案选择时说「单 Agent 自评够用了」。
“ 自评偏高的 Agent 恰恰无法发现自己在自评偏高。你不能指望一个系统性乐观的评审者告诉你「我太乐观了」。

这个矛盾我还真是完全没注意到。但凡你有过和 AI 多次交流后写文档的经验,你就会知道这种情况是非常常见的。
黄帽(收益)换了个角度看:
“ 厨具都有了。能部署、能查数据库、能操作浏览器、能跑测试。HARNESS.md 就是一份食谱,把这些现成的工具串成一条链就好。

绿帽(别误会……它负责的是创意)提了个我压根没想到的方向:
每个 HARNESS.md 跑完后,把「成功路径」提取为一份精炼的「经验卡」。下次遇到类似任务,先检索经验池来预填模板。
越跑越多,经验池越丰富,新 Harness 质量越高,又产出更好的经验卡。

这不就是自我进化了吗,真的还得是 AI,比我想的更 AI……
我的初版里压根没想到这一层。
最后,蓝帽做了最终综合:
11 条具体修改建议,3 个需要我拍板的分歧点,8 个按优先级排序的 TODO。

其中有一条建议我特别认同:草稿的定位应该从「调研报告」转为「试点计划」。
红帽说了,有理论有结构有模板,但没有故事。那就去跑一个真实任务,让案例本身成为故事。
09
文件即协作
后面更细的评审内容,和我们后续的交互,我就不过多展示了……因为这是一个没完成的真项目。
而且我还需要进一步打磨,还得找更多人来协作和验证,现在放出来为时尚早。我也考虑到这是周末,还没发给其他人来评审,拉上真人们来和 AI 们一起协作。
不过,在整个 Moxt 的使用过程中值得我关注的,倒不是哪顶帽子说了什么惊人的话,而是 6 个 Agent 之间确实在实时通过文件协作。
黑帽挑毛病的时候,引用了白帽验证过的事实:「白帽已确认该项目实际主语言是 Shell 和 Go」。
蓝帽做综合的时候,标注了每条建议的出处:「综合黑帽结构性盲区质疑 + 绿帽 AI 同事作为 Evaluator 创意 + 黄帽低成本启动原则」。

它们并非各写各的,而是在实时读取对方的产出,然后在自己的输出里引用、回应、反驳。
这才是 Workspace 的意义:给一组 AI 一张共享的工作台,而不只是一个聊天窗口。
真有点传统办公室里我们用飞书文档的感觉了。
Moxt 跟飞书 AI 伙伴的区别,也正在于此:飞书的 AI 伙伴是一个通用 AI,你问什么它答什么。Moxt 的 AI Teammates 是多个独立个体,通过文件产生关系。
打个可能不太恰当的比方,飞书 AI 像一个全能助理。而 Moxt 更像一间办公室,里面坐着几个人(AI),桌上放着共享文件夹,每个人翻完后在上面写自己的批注。
10
几个小问题
不过 Moxt 也有些使用上的小问题。
不能回滚:我第一次给帽子发 brief 的时候,本来想写多行文字,结果不小心敲了个回车(应该用 Shift+Enter 换行),结果就直接发送了。虽然可以中止,但我没找到怎么取消重来。
CLI 没有 API Key 入口:我让 Claude Code 找到 Moxt 有个 CLI 工具(@moxt-ai/cli),用它需要 API Key,但在它的网站里里找不到这个 Key 在哪,不知道是我不会找,还是光做了个工具……但钥匙没配好(我推测是正在开发快上线,没想到被我的 AI 找到了)。

前一个还好不太碍事,后一个有点不太符合我爱在终端里用的习惯……
11
零摩擦
Moxt 联创张昊然在其公众号文章中,提到了一个概念:零摩擦。
AI 处理信息的速率太快、带宽太大,哪怕只有 1% 的非原生损耗,在复杂任务的 n 次操作后也会被指数级放大。
所以 Moxt 把所有内容都转成了 .md、.csv、.html 这些 AI 原生的格式,知识组织用的是文件系统的目录结构。

回头看我这次为什么六顶思考帽能跑得通,也正是因为 AI 读写的就是最原生的 Markdown,存放在它们完全理解的目录里,所以才能更好的互相引用和回应。
Moxt 看起来还很早期,功能也在完善中。它的方向是:给 AI 一个真正适合它们工作的环境,而不只是在旧工具上加个聊天框。
不过在我看来,AI 的评审当然不能替代人的判断。
但它更好的帮我把「多角度审视」的时间成本和多人协作的沟通成本进行了压缩。
而这些省下来的时间,应该花在真正需要人的判断力的地方去。
◇ ◆ ◇
Moxt:https://moxt.ai
夜雨聆风
