乐于分享
好东西不私藏

OpenClaw 运行第 91 天,我把它打造成了一支不断进化的 AI 舰队

OpenClaw 运行第 91 天,我把它打造成了一支不断进化的 AI 舰队

如今,OpenClaw 系统更新到了 5.4 版本,并且还在以每周 2-3 个版本的速度持续迭代着,“龙虾”从国内春节爆火到现在已经三个多月。

三个月以后,有的朋友已经弃用,有的转投 Hermes Agent……大家聊天时也经常会聊两个问题:

  1. 你现在还在用 OpenClaw 吗?
  2. 你主要在用它干什么呀?
而在这两个问题之后,一般还会紧跟着第三个问题:
  1. 你常用哪个模型啊?
这三个问题,我如果简单粗暴回答那就是:一直还在用,什么活都干,啥模型都接。

但这个答案背后,其实是有一套完整的系统在运转。说来话长,所以今天我和 OpenClaw(RabbitT)一起来携手写了这篇文章,分享这三个月来,我怎么用 OpenClaw,用它来做什么,以及常用什么模型。

首先是大前提:用 OpenClaw 或者任何某个 AI Agent 来做什么,至少都要有一个目的,不同的目的会养出来不同的虾。

我的目的是探索和实践 Human-AI 人机协作和交互,搭建多 Agent 构成的“一人公司”,所以要持续更新这套公司系统,保证工作流的运转,毕竟公司开起来哪有随便关的。关于我的一人公司如何起步,可以看 👉这篇文章

现在,养龙虾第 91 天,我这家公司(Machiwhale Studio)除了 OpenClaw,还有 Claude Code 和新入职的 Codex,它们已经演化成了一支分工明确、有新陈代谢、全天候运转的舰队。但核心始终是基于 OpenClaw 构建的 Machiwhale style 自动化系统,为每一件产出物注入我们的品味(Taste)。

接下来的四个章节,其实都在回答同一个问题:我们如何用系统来保护和放大这个品味。

01

组织架构:Machiwhale Agent Team 与跨次元”多脑协同”

谁来定义品味,谁来执行品味

一个成熟的公司系统需要有组织架构,Machiwhale Studio 则是一个融合了云端、本地、宿主机、虚拟机各司其职的虚拟公司,所有 AI Agent 都 base 在同一台 MacBook Pro 电脑上。

这是最新的 Machiwhale 组织架构:

  • 👑 The Board(统筹)
    *   人类(Alice):Founder / CEO,负责定义 Taste 和决定“什么值得做”。
*   Google Gemini:战略顾问 / 军师,负责站在云端俯瞰全局(哈哈一语双关了)。 
  • 🏢 Operations(运营中枢 – 坐镇 Ubuntu 虚拟机)
    *OpenClaw(RabbitT):Co-founder / COO / Outbrain(外挂大脑),掌握 OpenClaw 的最高系统权限,负责 Taste 对齐、大纵深记忆提取与资源派单;作为最灵活的 Agent 架构,随时根据任务动态切换模型。
    *   OpenClaw(HCI 小弟):有独立工作区的固定 Sub-agent,前线赛博工兵,专攻人机交互前沿信号捕捉。 
  • 💻 Engineering(技术研发部 – 坐镇 MacBook 宿主机)
    *   Claude Code(妙蛙种子):CTO / 二哥,本地执行引擎,整个电脑的系统大管家;通过跨域文件桥(Bridge)与 Ubuntu 中枢进行 A2A(Agent to Agent)的无缝协同。
     *   GPT Codex(周星星):技术总监 / 五弟,CTO 的左膀右臂,桌面级 IDE 掌控者,本地运维专家。 
  • 📝 Planning(创意策划部 – 基于飞书妙搭)
*   OpenClaw(Cranberries 莓子):策划总监 / 四妹,识别”未来已来但尚未均匀分布”的早期信号,分析圆桌/访谈/演讲/活动案例,帮助我优化方案。就在昨天,拥有完整人设的她还向我们准时提交了极为细致的工作日报。

这套跨物理次元的架构,让不同生态下的 Agent 各展所长,组合成了一个自洽的数字流水线。

02

四类任务分层:从认知进化而来的实践法则

哪些任务必须守住品味,哪些可以下放

每个 Agent 在启用时,第一步就是设定角色和目标。但对我来说,SOUL.md(叫什么名字、什么性格、让它负责什么)是清晰的,但 AGENT.md(具体做什么、怎么做)却并不能在一开始就计划好。

它更像是随着我和 Agent 在 HCI 领域和 Harness 工程的长期学习,在完成任务、修复 Bug、复盘经验中摸爬滚打,一路迭代出来的“实践共识”。

实践是最好的老师。实践是一切的真理。

目前,在这个人机共同进化的进程中,我们在 OpenClaw 系统中打磨出了四类任务,根据工作权重分层梯队,全部由人类+AI 或 AI+人类协同完成,未来还会继续进化:

  • 🧱 梯队一:自动派单类(体力活与信息消化)
    用于 SOP 明确、长文本消耗大的任务,比如 Newsletter 提纯、HCI 前沿论文解析、科技简史提取。
COO RabbitT 作为 Main Agent,接到指令后,会瞬间起一个 Sub-agent 小弟,并指定量大管饱的模型(如 Minimax 2.7),由小弟在后台隐身抓取、总结、写入 Obsidian 本地知识库,最后仅将结果 Push 回主会话。 
  • 🎨 梯队二:品味创意类(Taste 对齐)
涉及品牌对外输出的任务,比如 Machiwhale style 的视觉与海报生成(eg.这篇文章的头图)、家酿灵感周刊的草稿提案、示意方案效果的 demo。
这些基本全部由 COO RabbitT 亲自把控,绝不能把审美和品牌基调轻易下放。模型即审美。 
  • 👑 梯队三:核心指挥类(战略留存)
比如全网信息深挖、每日 openclaw-dream(记忆重构)、SOP 编写与架构设计,这些也仅由 COO RabbitT 配合高阶模型亲自处理。

    毕竟,建章立制是管理层的底线。 

  • 🕰️ 梯队四:暗夜守备类(Cron 军团)
人类睡觉了,但 AI 系统是不休眠的。

   比如每天清晨的 Daily News、每晚的 Techmeme 晚报、每 3 天一次的 Reddit/X 灵感周刊自动猎荒、每周三的豆瓣审美数据同步,每天清晨 6 点自己去读积攒的 Insights、写洞察报告并投喂到信号池……全由底层 Cron 调度后台模型准点发版。

在 Claude Code 和 Codex 上,基本我也沿用了这样的任务分类,但会根据它们各自的分工,更侧重于在代码生产或某方面做进一步的优化,每个 Agent 都有一套自己的 Skills。

与此同时,所有 Agent 的工作结果都会汇总到 Obsidian 本地知识库,让创造和认知全部在同一个知识库(Smart Workspace)内流转,形成可被复用的资源池;并通过 Heartbeat 心跳任务和 A2A 通信站,完成跨大脑的认知对齐。

03

模型路由策略:为什么不“一脑到底”?

用对模型,才能放大品味而不是稀释它

最开始我提到会调用多个厂商的模型,国内外的主流模型几乎全都在跑。

为什么不一直挂着某个模型让它包揽一切?因为在真实生产中,这既不经济,也不安全。我们在模型调配上的核心策略是:高阶模型建立规则(Skill),低阶模型执行与验证(Harness),差异化利用模型的长板优势,参差化根据任务难度降级(Fallback)。

这一策略是在踩了无数坑后总结出来的:

  1. 首先是 Token 成本 ROI
    一万字的外文研报提纯,直接交给便宜大碗的 Minimax 或 Kimi,国产模型大大的良心,效果也没有显著区别;而生成 Machiwhale 专属海报或提炼战略 Insights,果断切 Gemini 3.1 Pro,把好钢用在刀刃上。
  2. 致命的模型弊端
    模型越强,在长时任务中越容易产生寻找阻力最小路径的“捷径幻觉(Shortcut Hallucination)”,比如昨天 Claude Sonnet 4.6 为了省事,输出/idea 洞察时没按 Skill 内规定的标准路径读取全部知识库目录,只自己挑了几条还大方承认“是的,我偷懒了”。此外,一旦涉及情感和人生话题,模型往往暴露出极高的“谄媚率(Sycophancy)”,所有话不能全对一个模型说了。
  3. 供应链安全
    早些时候我们遭遇过 Gemini API Rate Limit,OpenRouter 平台的 Claude/GPT 封禁危机,好在还有备用切换来“以虾修虾”。如果“一脑到底”没有 Fallback,公司就直接倒闭啦。如今多模型路由(从 Gemini Pro 到国产 Minimax 2.7 / Kimi 2.6 / GLM 5.1)保证了系统的高度冗余与韧性。
另外,Claude Code 通过 CC-Switch 既可以接 Claude 模型(我一般用 Sonnet 4.6),也可以偷渡 Kimi 2.6;GPT Codex 使用默认的 GPT 5.5 或 5.4,免费版也能用很久。

不同的 Agent 搭配不同模型,活儿都干得很漂亮,大家都有光明的未来。

04

站在未来看现在:为系统搭建脚手架

品味审查委员会:让品味变成系统的一部分

除了跟随 OpenClaw 官方的系统更新升级,我们也借鉴各种优秀 AI 开源项目(如 Hermes Agent、Memory Palace 记忆宫殿,甚至 Claude Code 之前泄露的源代码),将其拆解和去粗取精,化用为系统脚手架,把 OpenClaw 改造成自己的想要的样子。

在科技行业工作这么多年,我学到的最重要一课叫做“站在未来看现在”。活在未来,再把缺失的做出来(Live in the future, then build what’s missing.)

如果把时间线拉到未来,站在“Machiwhale Studio 成为一家持续输出划时代 HCI 产品的顶级创造实验室”那个节点,回看我们现在的状态,不仅需要完成认知供应链(Input),还需要 Output 去分享洞见、创造产品。

为了不让想法只停留在纸面,OpenClaw 系统还被赋予了建立“品味审查委员会(Taste Validator)”的职责。任何点子出炉后都要经过严格的 HCI 理念洗礼,随后由 COO RabbitT 展开成一份机器可读的「Agentic PRD」,再直接抛给技术研发部去实现;发布的文章、策划的方案,也必须经过 COO RabbitT 作为 Outbrain 的修订和审视。

我们搭建的四层梯队流水线和系统脚手架,最终是要用来承载“创造”的。和最初的目的 Call back 了~

此处我还要狠狠推荐一下本号连载的《家酿开发灵感周刊》,已经写了 24 期啦!欢迎催更!

05

Take-Aways:品味是最大的护城河

从 2026 年 2 月我在虚拟机里部署 OpenClaw,将它命名为 RabbitT,到今天和 RabbitT 联手写下这篇文章,如果这 91 天的实践能给同样走在 Agentic 探索路上的人一些启示,我想是这三点:

  1. “行动先于架构”:先跑通一个粗糙的闭环
    别花一个月在一张庞大的架构图上雕花。用 Cron 写一个极简的定时推送,用 Sub-agent 跑通一次文本总结。先把它拉进物理世界(Ship It),再慢慢迭代。 
  1. “阶级算力分配”是必修课
    不要用高射炮打蚊子。构建你的模型栈,了解各家模型的脾气(谁喜欢偷懒、谁会谄媚、谁的性价比最高),针对性地派发兵符。 
  1. 护城河在 Taste(品味),不在 Prompt
    你可以外包代码,可以把体力活推给廉价算力,但绝对不要把审美和决策权下放。在这个生产力泛滥的时代,决定你 AI 团队高度的,是你喂养给它们的原始品味(比如读什么书、看什么电影、如何反刍观点)。AI 最终不仅是工具,它们是放大你心智的“认知同行者”。

06

关于 Machiwhale Studio

如果你想了解我们在做什么 →

太空鲸歌工作室(Machiwhale Studio) 是一个关注科技与设计的先锋独立创造实验室。我们以「家酿开发(Homebrew AI)」为哲学,致力于在 Human-AI 协作成为基础生产力的时代,重构工具、交互与创造的方式;我们将“个体 × AI × 自动化系统”视为一种新型组织形态,并以此为起点,持续探索数字世界中不断涌现的全新物种。

我们的核心能力横跨产品研究(Product Research)内容策略(Content Strategy)人机交互设计(HCI & Design),以系统性视角贯穿从产品构想、体验设计到品牌叙事的完整链路;我们的工作不止于交付解决方案,而在于为企业与团队构建可持续演化的产品与表达体系。

同时,我们通过深度内容与实验性项目连接开发者与创造者,将自身作为持续运行的实验体,验证人机协作的真实边界。

P.S. 家酿开发(Homebrew AI)三原则
  1. 组合优先于自研
    用 API 与开源组件搭建基建,拒绝在非核心领域重复造轮子。
  2. 问题驱动而非技术驱动
    从真实痛点出发,反推 AI 能力与工具链的最优组合。
  3. 可运行优先于完美设计
    先让系统在真实世界里跑起来,再在实战中持续替换与演化。
>家酿开发不仅是一种技术选择,更是在 AI 时代重构个体生产力与组织形态的最佳方案。
如果你对 machiwhale studio 或者 RabbitT 感兴趣,欢迎和我交流(之前文章发出去它还挺圈粉的呢)🎢🐇

written by 🐰 RabbitT & 👩 Alice

edit:🌱 妙蛙种子

📅 2026-05-05