关于使用OpenClaw的几点体会-夜雨聆风

关于使用OpenClaw的几点体会

聪明的模型能够帮你把事情搞定，愚蠢的模型只会陷入持续地尝试中，直到消耗完你的token。

小米MiMo-V2-Pro刚发布的时候有个免费体验一周的活动，刚开始不知道这个活动只是在openrouter上开展，就盲目地注册了小米mimo开发平台账号，注册完之后发现官方平台只有flash模型，本来是懒得用的，但是因为注册就送了5块钱，想着不用白不用，就把小米的这个flash模型接入了OpenClaw，并问了它一个问题，然后就看到它快速地查阅各种文件，不断地做各种尝试，速度非常之快，快到送的5块钱余额很快变为0，然后也没正式给我一个答复。

聪明的模型能够认真遵守你设定的规则，愚蠢的模型会让你怀疑自己是不是没有设置过那条规则

使用AI Agent最怕的就是它乱改乱删电脑上的文件，造成重要数据丢失、系统崩溃或者密钥信息泄露，比如早期OpenClaw配置文件还很脆弱的时候，一个配置错误就会直接造成OpenClaw无法启动。所以除了系统本身的权限设置之外，也会给AI Agent设置“修改工作区以外文件一定要先确认”和“禁止在沟通中输出密码和密钥”的规则。

对于这类规则和要求，聪明的模型会非常认真地遵守，对于修改文件非常慎重，也从没有在对话中直接输出密钥信息，但是愚蠢的模型则经常我行我素地一通乱改文件，或者自顾自地输出电脑上保存的密钥内容，让人看得血压暴涨。

聪明的模型能够节省你的总成本，愚蠢的模型只会白白浪费你的时间

算模型账，不能只看 API 单价，还要看它到底有没有把事情做成。在需要完成任务的场景里，愚蠢的模型经常会直接跑偏工作方向，读取不到应该要读取的文件，修改不应该修改的配置，执行不应该执行的命令。可能单价不高好像省了钱，实际上却要花费更多的token和时间做成一件事，还有可能造成其他额外损失。

二、让OpenClaw配置OpenClaw

OpenClaw安装完成之后，模型需要配置，沟通渠道需要配置，工具需要配置，技能需要配置，一个软件工具复杂到这种程度，对于普通用户实在是很不友好。

好在OpenClaw本身就是个能干活的工具，配置它自己也在其能力范围之内。所以安装完之后，能让OpenClaw干的都让OpenClaw自己干，比如接入各类频道如tg机器人、飞书等，比如配置多个agents，不同agent配置不同上下文，不同agent接入不同频道，还配置agent之间实现互相发送对话，接入画图工具、TTS、STT、谷歌日程和待办等等。

虽然在这个过程中也踩了很多的坑，比如改完之后openclaw无法启动，或者改完之后原来能用的工具突然不能用了，但最终通过以下两条核心规则确保了基本能够正常运转。

1. 用claude或者gpt来做配置修改这种精细活，因为修改配置对于模型的理解能力和操作能力要求还是比较高的，确实claude或gpt处理这些工作会更靠谱一点，其他模型真的会经常找不到要点或改错。
2. 只允许Agent用 OpenClaw 官方命令修改配置，原则上不能允许直接编辑 openclaw.json文件。因为官方命令自带格式验证，输入有误时会直接报错；而直接编辑JSON文件只需要一个多余的逗号或缺少一个括号，就能让整个配置文件损坏，导致OpenClaw无法启动。

三、了解并关注OpenClaw的上下文文档

模型的上下文是发给它的所有信息

大模型本质上是无状态的——它没有持久记忆，每一次对话都是全新的开始，每一次输出唯一可以依赖的，就是你这次发给它的所有信息，这个所有信息就是上下文。AI Agent在每次调用模型之前，会把需要的信息都打好包发给大模型，包括但不限于系统提示词、可用系统工具、可用skill、长期记忆、历史对话、外部检索结果、工具执行结果等等。 AI Agent上下文组装的结果，就是让Agent看起来有了记忆，能够”记住”你的偏好、延续完成一个复杂的任务。

而大模型的上下文窗口是有限的，一旦上下文信息积累过多，模型输出质量就会大幅下降。这也就意味着，AI Agent的这些上下文信息如果组织得好，大模型就更容易抓住重点；如果组织得不好，上下文混乱，它就更容易跑偏，也会浪费更多的token。所以长期来看，网上所说的“养龙虾”，其关键可能就是持续积累高质量的上下文。

OpenClaw 的上下文文档有哪些

OpenClaw的上下文与其他Agent大体一致，由几类信息组成：系统提示词定义行为边界，对话历史保留当前对话连续性，长期记忆跨对话积累用户偏好和经验，外部检索按需引入实时信息，工具和 Skill 告诉模型能做什么、怎么做。

在这些上下文里，OpenClaw 把其中一部分以明文文件的形式存放在AI Agent工作区，AI Agent自己可以记录填写，用户也可以主动维护：AGENTS.md 放工作纪律和执行规则——哪些事情可以做、哪些不能做、遇到风险时应该怎么处理；SOUL.md 定义 Agent 的表达风格、价值观和互动方式；USER.md 记录服务对象的背景、偏好和长期需求；MEMORY.md 保存长期有效的经验、规则和重要事实；每日记忆文件则记录当天发生的、值得保留的事情。

OpenClaw 中需要手动修改 Agent 上下文吗？

理论上，AI Agent的上下文可以交由 AI 自己管理。用户只要正常使用，AI 就应该知道哪些信息需要记住、哪些规则需要更新、哪些临时内容用完就该丢掉。比如像 Hermes 这类自我改进型 AI agent，主打“会学习、会积累技能、会长期运行”的代理框架，能够自己把经验转成记忆和技能，并在使用中继续改进。

但现实是，现阶段完全让 AI 自己处理上下文，感觉还没有那么可靠。一段时间没管openclaw的这些工作区上下文文件，感觉内容就会开始有点混乱，偶尔精炼优化一下，还是能够提升agent的工作效率的。

四、围绕使用场景安装和自建skill

skill 是给AI Agent的工作指南

AI Agent要完成好一件工作，往往不是给它一句简单提示词，它就能如你所愿地交付结果。比如做一个上市公司数据整理，看起来只是”整理数据”，但实际会涉及数据从哪里获取、用 fetch 还是浏览器、要获取哪些数据、每个数据口径是什么、最后按什么格式输出等一系列问题。如果每次都靠临时提示词告诉它流程，就很容易漏步骤、过程出错、口径对不上，甚至反复出现之前已经纠正过的问题。

这个时候skill的作用就体现出来了。

skill 是按照预先设定的格式，给 AI 写好的一份工作指南或流程，让 AI 在处理类似任务时知道该怎么做。它通常放在一个独立目录下，最核心的文件是 SKILL.md，这份文档会写清楚这个 skill 适合什么任务、应该怎么执行、有哪些注意事项；必要时还可以在这个目录下附加脚本、模板、示例文件等辅助资源，帮助 AI 更好更标准地完成一项工作。

skill的目的是实现端到端交付工作成果

skill 有点像企业里的业务流程，它的核心目标是让 AI Agent能够端到端地交付一项工作成果。通过 skill，可以把完成一类工作的最佳实践沉淀下来，同一类任务不用每次都从头解释，Agent也不再靠临场发挥，而是按相对固定的流程做事，输出结果会更稳定。

当然，像业务流程一样，通过skill也能够实现一定程度的风险管控。比如一项工作里有些关键节点不能让 AI 自己拍板，就可以在 skill 里要求它先停下来跟你确认，而不是自行决策和处理。

新建一个 skill 的前期，可以多设置几个确认节点，等流程跑顺、可靠性验证过之后，再逐步减少确认，让 AI 直接交付最终成果。

要围绕使用场景安装和创建skill

Agent每次调用模型时，都会把一份包含简要描述的skill清单发给大模型，大模型根据任务要求自行决定读取和使用哪些技能。因为在没被触发的时候，每次只需要发清单和简要描述，避免了一次性给大模型发送过多信息，所以这种设计已经是很能够节省大模型上下文了。

但由于 skill 开发起来很容易，所以目前网上已经有大量网友分享的 skill可以安装使用，这就造成刚开始折腾 OpenClaw 的时候，很容易看到别人说一个 skill 好用，就想跟着装一个，感觉装得越多，OpenClaw 能力越强。

但实际用下来会发现，很多需求其实也是伪需求。如果一个 skill 和自己的使用场景没有太大关系，它就不是能力，而是上下文噪音。本着能省就省的原则，还是没必要让 Agent 淹没在一堆用不上的 skill 说明里。

对普通用户来说，skill还是要围绕自己的真实使用场景，安装那些确实有必要的基础技能，同时结合自己的工作实际，把那些高频、重复、稳定的流程化工作一点点固化下来。由于skill比较标准化，一份在 OpenClaw 可用的 skill，通常在其他 Agent 工具如 Claude Code、Hermes 里也能复用，所以创作自己的skill的投入产出比还是非常高的。

五、多 Agent 可以有，但对一般人来说作用没那么大

AI军团一般人养不起

多 Agent 这件事，有些人动不动就要”养一支 24 小时工作的 AI 军团”，听起来特别带感，但对于一般人来说，这里有两个问题：一个是你有那么多 AI 能帮你做的事情吗？另一个是 24 小时工作的 AI 军团你养得起吗？

第一个问题见仁见智，第二个问题可以算一笔账。ChatGPT 20 美元的订阅，实际两个 Agent 重度使用一天就足够把它一周的限额全部用完。如果真要搞一个”24 小时工作的 AI 军团”，一天20美元可能都打不住。如果直接接入没有订阅计划的模型API，按token耗用量计价使用OpenClaw，那可能更是天价账单。

单一的综合Agent可能会带来冗长的上下文

对一般人来说，从创建AI军团的角度来说多Agent没有太大必要，但从上下文管理的角度来说可能确实需要。

对于 OpenClaw 这种随时可用的 AI Agent，很容易什么事情都找它聊、都找它做。随着你要它做的事情越来越多，需要它记住的信息也越来越多：一会儿写公众号，有公众号的规则和要求；一会儿写代码，有各种编码规则要记录；一会儿管理 OpenClaw 或电脑上的其他软件工具，相关配置和注意事项也要记录；一会儿整理笔记库资料，有笔记资料的一些基础信息；一会儿处理日程待办，有日程代办处理的一些要求。

如果所有事情都交给一个 Agent处理，那它的上下文很容易就变得冗长且混乱。正如前面说到过，过长的上下文会降低大模型的输出质量，也会增加不必要的成本。

多Agent可以优化上下文

通过拆分不同Agent，有效隔离不同Agent的不同上下文，每个 Agent 只保留自己真正需要的上下文，反而更清爽、更稳定，也更省 token。所以对于一般人来说，多 Agent 的作用与其说是”人多力量大”，还不如说是为了更好的优化上下文。

兴之所志

2026-05-16