乐于分享
好东西不私藏

关于使用OpenClaw的几点体会

关于使用OpenClaw的几点体会

聪明的模型能够帮你把事情搞定,愚蠢的模型只会陷入持续地尝试中,直到消耗完你的token。

小米MiMo-V2-Pro刚发布的时候有个免费体验一周的活动,刚开始不知道这个活动只是在openrouter上开展,就盲目地注册了小米mimo开发平台账号,注册完之后发现官方平台只有flash模型,本来是懒得用的,但是因为注册就送了5块钱,想着不用白不用,就把小米的这个flash模型接入了OpenClaw,并问了它一个问题,然后就看到它快速地查阅各种文件,不断地做各种尝试,速度非常之快,快到送的5块钱余额很快变为0,然后也没正式给我一个答复。

聪明的模型能够认真遵守你设定的规则,愚蠢的模型会让你怀疑自己是不是没有设置过那条规则

使用AI Agent最怕的就是它乱改乱删电脑上的文件,造成重要数据丢失、系统崩溃或者密钥信息泄露,比如早期OpenClaw配置文件还很脆弱的时候,一个配置错误就会直接造成OpenClaw无法启动。所以除了系统本身的权限设置之外,也会给AI Agent设置“修改工作区以外文件一定要先确认”和“禁止在沟通中输出密码和密钥”的规则。

对于这类规则和要求,聪明的模型会非常认真地遵守,对于修改文件非常慎重,也从没有在对话中直接输出密钥信息,但是愚蠢的模型则经常我行我素地一通乱改文件,或者自顾自地输出电脑上保存的密钥内容,让人看得血压暴涨。

聪明的模型能够节省你的总成本,愚蠢的模型只会白白浪费你的时间

算模型账,不能只看 API 单价,还要看它到底有没有把事情做成。在需要完成任务的场景里,愚蠢的模型经常会直接跑偏工作方向,读取不到应该要读取的文件,修改不应该修改的配置,执行不应该执行的命令。可能单价不高好像省了钱,实际上却要花费更多的token和时间做成一件事,还有可能造成其他额外损失。

二、让OpenClaw配置OpenClaw

OpenClaw安装完成之后,模型需要配置,沟通渠道需要配置,工具需要配置,技能需要配置,一个软件工具复杂到这种程度,对于普通用户实在是很不友好。

好在OpenClaw本身就是个能干活的工具,配置它自己也在其能力范围之内。所以安装完之后,能让OpenClaw干的都让OpenClaw自己干,比如接入各类频道如tg机器人、飞书等,比如配置多个agents,不同agent配置不同上下文,不同agent接入不同频道,还配置agent之间实现互相发送对话,接入画图工具、TTS、STT、谷歌日程和待办等等。

虽然在这个过程中也踩了很多的坑,比如改完之后openclaw无法启动,或者改完之后原来能用的工具突然不能用了,但最终通过以下两条核心规则确保了基本能够正常运转。

  1. 1. 用claude或者gpt来做配置修改这种精细活,因为修改配置对于模型的理解能力和操作能力要求还是比较高的,确实claude或gpt处理这些工作会更靠谱一点,其他模型真的会经常找不到要点或改错。
  2. 2. 只允许Agent用 OpenClaw 官方命令修改配置,原则上不能允许直接编辑 openclaw.json文件。因为官方命令自带格式验证,输入有误时会直接报错;而直接编辑JSON文件只需要一个多余的逗号或缺少一个括号,就能让整个配置文件损坏,导致OpenClaw无法启动。

三、了解并关注OpenClaw的上下文文档

模型的上下文是发给它的所有信息

大模型本质上是无状态的——它没有持久记忆,每一次对话都是全新的开始,每一次输出唯一可以依赖的,就是你这次发给它的所有信息,这个所有信息就是上下文。AI Agent在每次调用模型之前,会把需要的信息都打好包发给大模型,包括但不限于系统提示词、可用系统工具、可用skill、长期记忆、历史对话、外部检索结果、工具执行结果等等。 AI Agent上下文组装的结果,就是让Agent看起来有了记忆,能够”记住”你的偏好、延续完成一个复杂的任务。

而大模型的上下文窗口是有限的,一旦上下文信息积累过多,模型输出质量就会大幅下降。这也就意味着,AI Agent的这些上下文信息如果组织得好,大模型就更容易抓住重点;如果组织得不好,上下文混乱,它就更容易跑偏,也会浪费更多的token。所以长期来看,网上所说的“养龙虾”,其关键可能就是持续积累高质量的上下文。

OpenClaw 的上下文文档有哪些

OpenClaw的上下文与其他Agent大体一致,由几类信息组成:系统提示词定义行为边界,对话历史保留当前对话连续性,长期记忆跨对话积累用户偏好和经验,外部检索按需引入实时信息,工具和 Skill 告诉模型能做什么、怎么做。

在这些上下文里,OpenClaw 把其中一部分以明文文件的形式存放在AI Agent工作区,AI Agent自己可以记录填写,用户也可以主动维护:AGENTS.md 放工作纪律和执行规则——哪些事情可以做、哪些不能做、遇到风险时应该怎么处理;SOUL.md 定义 Agent 的表达风格、价值观和互动方式;USER.md 记录服务对象的背景、偏好和长期需求;MEMORY.md 保存长期有效的经验、规则和重要事实;每日记忆文件则记录当天发生的、值得保留的事情。

OpenClaw 中需要手动修改 Agent 上下文吗?

理论上,AI Agent的上下文可以交由 AI 自己管理。用户只要正常使用,AI 就应该知道哪些信息需要记住、哪些规则需要更新、哪些临时内容用完就该丢掉。比如像 Hermes 这类自我改进型 AI agent,主打“会学习、会积累技能、会长期运行”的代理框架,能够自己把经验转成记忆和技能,并在使用中继续改进。

但现实是,现阶段完全让 AI 自己处理上下文,感觉还没有那么可靠。一段时间没管openclaw的这些工作区上下文文件,感觉内容就会开始有点混乱,偶尔精炼优化一下,还是能够提升agent的工作效率的。

四、围绕使用场景安装和自建skill

skill 是给AI Agent的工作指南

AI Agent要完成好一件工作,往往不是给它一句简单提示词,它就能如你所愿地交付结果。比如做一个上市公司数据整理,看起来只是”整理数据”,但实际会涉及数据从哪里获取、用 fetch 还是浏览器、要获取哪些数据、每个数据口径是什么、最后按什么格式输出等一系列问题。如果每次都靠临时提示词告诉它流程,就很容易漏步骤、过程出错、口径对不上,甚至反复出现之前已经纠正过的问题。

这个时候skill的作用就体现出来了。

skill 是按照预先设定的格式,给 AI 写好的一份工作指南或流程,让 AI 在处理类似任务时知道该怎么做。它通常放在一个独立目录下,最核心的文件是 SKILL.md,这份文档会写清楚这个 skill 适合什么任务、应该怎么执行、有哪些注意事项;必要时还可以在这个目录下附加脚本、模板、示例文件等辅助资源,帮助 AI 更好更标准地完成一项工作。

skill的目的是实现端到端交付工作成果

skill 有点像企业里的业务流程,它的核心目标是让 AI Agent能够端到端地交付一项工作成果。通过 skill,可以把完成一类工作的最佳实践沉淀下来,同一类任务不用每次都从头解释,Agent也不再靠临场发挥,而是按相对固定的流程做事,输出结果会更稳定。

当然,像业务流程一样,通过skill也能够实现一定程度的风险管控。比如一项工作里有些关键节点不能让 AI 自己拍板,就可以在 skill 里要求它先停下来跟你确认,而不是自行决策和处理。

新建一个 skill 的前期,可以多设置几个确认节点,等流程跑顺、可靠性验证过之后,再逐步减少确认,让 AI 直接交付最终成果。

要围绕使用场景安装和创建skill

Agent每次调用模型时,都会把一份包含简要描述的skill清单发给大模型,大模型根据任务要求自行决定读取和使用哪些技能。因为在没被触发的时候,每次只需要发清单和简要描述,避免了一次性给大模型发送过多信息,所以这种设计已经是很能够节省大模型上下文了。

但由于 skill 开发起来很容易,所以目前网上已经有大量网友分享的 skill可以安装使用,这就造成刚开始折腾 OpenClaw 的时候,很容易看到别人说一个 skill 好用,就想跟着装一个,感觉装得越多,OpenClaw 能力越强。

但实际用下来会发现,很多需求其实也是伪需求。如果一个 skill 和自己的使用场景没有太大关系,它就不是能力,而是上下文噪音。本着能省就省的原则,还是没必要让 Agent 淹没在一堆用不上的 skill 说明里。

对普通用户来说,skill还是要围绕自己的真实使用场景,安装那些确实有必要的基础技能,同时结合自己的工作实际,把那些高频、重复、稳定的流程化工作一点点固化下来。由于skill比较标准化,一份在 OpenClaw 可用的 skill,通常在其他 Agent 工具如 Claude Code、Hermes 里也能复用,所以创作自己的skill的投入产出比还是非常高的。

五、多 Agent 可以有,但对一般人来说作用没那么大

AI军团一般人养不起

多 Agent 这件事,有些人动不动就要”养一支 24 小时工作的 AI 军团”,听起来特别带感,但对于一般人来说,这里有两个问题:一个是你有那么多 AI 能帮你做的事情吗?另一个是 24 小时工作的 AI 军团你养得起吗?

第一个问题见仁见智,第二个问题可以算一笔账。ChatGPT 20 美元的订阅,实际两个 Agent 重度使用一天就足够把它一周的限额全部用完。如果真要搞一个”24 小时工作的 AI 军团”,一天20美元可能都打不住。如果直接接入没有订阅计划的模型API,按token耗用量计价使用OpenClaw,那可能更是天价账单。

单一的综合Agent可能会带来冗长的上下文

对一般人来说,从创建AI军团的角度来说多Agent没有太大必要,但从上下文管理的角度来说可能确实需要。

对于 OpenClaw 这种随时可用的 AI Agent,很容易什么事情都找它聊、都找它做。随着你要它做的事情越来越多,需要它记住的信息也越来越多:一会儿写公众号,有公众号的规则和要求;一会儿写代码,有各种编码规则要记录;一会儿管理 OpenClaw 或电脑上的其他软件工具,相关配置和注意事项也要记录;一会儿整理笔记库资料,有笔记资料的一些基础信息;一会儿处理日程待办,有日程代办处理的一些要求。

如果所有事情都交给一个 Agent处理,那它的上下文很容易就变得冗长且混乱。正如前面说到过,过长的上下文会降低大模型的输出质量,也会增加不必要的成本。

多Agent可以优化上下文

通过拆分不同Agent,有效隔离不同Agent的不同上下文,每个 Agent 只保留自己真正需要的上下文,反而更清爽、更稳定,也更省 token。所以对于一般人来说,多 Agent 的作用与其说是”人多力量大”,还不如说是为了更好的优化上下文。

兴之所志

2026-05-16