OpenClaw 从 0 到 1(01)
1. 先别急着写自动化:先搭好 OpenClaw 的底层心智模型
很多人第一次接触 OpenClaw,会把它当成“会调 API 的聊天机器人”。 这理解不算错,但远远不够。
如果你想把它真正用到业务里,你需要先建立一个更准确的认知:
OpenClaw 不是单点能力,而是一套“模型 + 工具 +记忆 + 编排 + 渠道”的执行系统。
今天这篇,就做一件事: 把这套系统从 0 到 1 拆开,让你知道每个部件到底在干嘛。
2. 一、先建立一张脑内架构图(最重要)
把 OpenClaw 想成五层:
交互层(Channel)
飞书、Telegram、Discord、网页会话……消息从这里进来,也从这里出去。决策层(Agent/Model)
模型负责理解意图、规划步骤、决定是否调用工具。能力层(Tools + Skills)
Tools:原子能力(读文件、写文件、跑命令、发消息、控浏览器) Skills:可复用流程模板(针对特定任务的作业手册)
状态层(Session + Memory)
Session:当前会话上下文(短期) Memory:跨会话记忆(长期)
执行层(Runtime + Host)
实际跑命令、执行脚本、访问本地资源/节点环境的地方。
一句话总结:
Channel 负责入口,Model 负责大脑,Tools/Skills 负责手脚,Memory 负责记忆,Runtime 负责落地执行。
3. 二、为什么很多 Agent“能演示,不能落地”?
因为只做了“模型回答”,没做“系统闭环”。
落地必须有这 4 个闭环:
输入闭环:消息能稳定进入(多渠道路由明确) 执行闭环:该调用工具就调用,不靠“嘴上完成” 状态闭环:做过什么、失败在哪、后续怎么接上 输出闭环:结果能回到正确的人/会话/线程
OpenClaw 的价值就是把这四个闭环拼起来,而不是只给你一个 chat UI。
4. 三、一个最小实战案例(真的 0→1)
目标:用户说“帮我生成今天的日报草稿”,Agent 自动完成。
4.1 流程拆解
用户在飞书发一句话 Agent 识别任务类型(日报) 调用 read读取历史日报模板调用 exec或内部逻辑整理当日变更调用 write生成新 Markdown调用 message回传结果链接/正文摘要
这个过程里,模型不直接替你“想象完成”,而是驱动真实工具执行。
所以它是“可验证”的:文件在不在、内容对不对、命令有没有报错,一眼可查。
5. 四、你必须搞清楚的 6 个关键概念
5.1 1) Tool-first,不是 Prompt-first
复杂任务优先拆成工具动作,不要幻想一段超长提示词万能解决。
5.2 2) Session 是短期记忆,不是永久记忆
会话能承接上下文,但不等于长期记忆库。长期信息要进 Memory。
5.3 3) Skill 是“流程资产”
把高频任务沉淀成 Skill,团队才能复用,而不是每次临场发挥。
5.4 4) Sub-agent 适合重任务隔离
长任务、复杂编码、多步骤排查,用子代理拆出去,主线程保持干净。
5.5 5) 编排比“单次回答”更重要
真正生产环境是持续运行,不是一次性问答。heartbeat/cron/事件触发要设计好。
5.6 6) 可靠性优先于“聪明感”
失败可重试、过程可追踪、权限可控,永远比“回答得像人”更重要。
6. 五、新手最容易踩的坑(避坑清单)
坑 1:把 Agent 当万能助手,不给工具权限
结果:只会说不会做。坑 2:任务定义太模糊
结果:模型频繁走偏,输出看似努力但不可用。坑 3:不做状态记录
结果:中断后无法续跑,重复劳动。坑 4:把所有逻辑塞进一个超长 Prompt
结果:脆弱、不可维护、不可复用。坑 5:无节制并发调用外部 API
结果:撞限流、失败率升高、成本不可控。
7. 六、第 1 期结论(你现在该做什么)
别急着做“大而全自动化”。
先做一个最小闭环任务,满足这 3 条就及格:
能被用户一句话触发 至少调用 2 个工具完成真实执行 有明确结果回传 + 失败可见
先把“可执行闭环”打通,再谈规模化。
8. 七、课后作业(建议你真的做)
选一个你每天都在重复的动作(如日报、素材整理、线索汇总),按下面模板写一版:
触发语:用户说什么 输入源:从哪读数据 工具链:按步骤调用哪些工具 输出物:最终产物是什么(文件/消息/表格) 失败处理:哪一步失败时怎么回退或提示
你做完这份作业,基本就跨过“看懂 Agent”到“能造 Agent”的门槛
夜雨聆风