LLM的DeepSeek成为划时代产品后,我一直在等能帮我干活的AI,等了一年它来了。3月份OpenClaw火了,我用了一段时间后发现:这玩意儿真能干活。
它和LLM的AI有什么区别?
LLM AI(ChatGPT、豆包等):主要是获取知识和信息,代替搜索引擎
你问它答,不问不答
只能给文字回答,无法帮你操作
OpenClaw:
24小时待命,一直在线
能操作电脑、读写文件、发送消息、跑脚本
有长期记忆,能记住你说过的事
不仅给答案,还帮你把事情做完
Agent能够完成从未被编程、从未被预设的任务,纯粹靠通用问题解决能力加上对本地电脑的访问权,直接创造出解决方案。
从回答问题和写代码,变成自行安装软件并写代码完成任务,能直接给到结果,不是一个中间态,因为中间态在普通人那里后续可能会卡住而得不到结果。
Agent重点功能是记忆、任务流程、脚本;就是能记住怎么干活,保持灵活性的同时还能通过脚本代码做标准化和固化。

简单的任务Agent一次性就能做好流程和脚本,复杂的需要几轮对话教一下。需要注意,Agent主要依靠上下文和LLM来理解+分解+执行任务,可能每次都不一样,可能会忘记之前的错误和指导。先让Agent自己跑任务流程,再指导优化流程,流程完整没有错误后再编写代码,让Agent记住触发词,后续执行此任务就可以使用代码。
所以要想真正干好活,更依赖我们想清楚需要什么并且可以评估好坏,描述不全就要一点一点教,有了完整具体的要求再加上持续的改正,Agent就能干好活了。
一、OpenClaw能做什么?
📁 文件与数据处理
批量读写、整理文件
操作Obsidian笔记库
抓取微信公众号文章保存到本地
处理PDF、CSV、Xmind等格式
🔍 信息收集
全网搜索、深度抓取网页、信息调研
追踪GitHub Issues、自动修复Bug
抓取微信公众号/小红书/知乎等内容
🛠 开发者工作流
操作GitHub、建立网站
写代码、改代码、审代码
安全审计、节点诊断
☁ 办公集成
飞书文档、云盘、知识库操作、多维表格读写
发送邮件、发送IM消息
翻译、生成方案、编辑文章、媒体发布、生成图片视频
⏰ 自动化
定时任务(cron)
多步骤工作流
子Agent并行/串行执行
📅 日常助手
查天气、记日志
维护记忆、安排提醒
批量发送消息
核心优势是工具组合——比如"抓取网页 → 提取关键信息 → 存到笔记库 → 提醒你"这种一条龙服务。
Agent基于LLM的擅长能力:分解执行任务、写脚本、执行CLI和API。
二、OpenClaw优势
24小时运转的持续存在,不只是一问一答的触发模式。
能干活:不只是回答问题,不是工具,而是完成任务,能交付结果
有记忆:长期记忆,文件记录持久记忆
自动生成Skills:Github开源代码变成Skills,自己写Python代码执行任务,自动查找Skills并使用,Agent可共享Skills
跨域操作:微信公众号、飞书表格、小红书、App(日历、笔记、IM渠道,无需登录认证)、文件仓库
跨信息格式处理Human2Agent:文本文章<-->Markdown、写Python代码、把人类的经验和知识通过Skills和知识库注入Agent变成数字资产
Agent协同:本地文件信息交换、定时任务触发;沟通损耗几乎为0,知识和技能传递成本几乎为0
复杂任务:
未提前训练任务:完成从未被编程、从未被预设的任务,纯粹靠通用问题解决能力加上对本地电脑的完全访问权,即刻创造出解决方案
目标结果的任务分解与执行,任务流程和踩坑经验可固化为Skills持续迭代
脑子里面的知识和经验可以变成Skills的数字资产
主动性:心跳heartbeat.md里面记着待办任务和周期性提醒(让Agent检查一下有没有事情可以做,提醒事项有活人感),完成未知任务(给建议->替我执行)
代替App:无需UI界面操作(API、CLI、MCP)
不是工具,是有记忆、有经验、能持续成长、7x24小时上班的AI数字员工。
告诉需求,直接提供成果,Agent自己搞定中间的环境、配置、代码。
1、部署方式区别
云端部署与Manus基本没有区别。
本地电脑可以读用户桌面上的所有文件,帮用户清理磁盘、调整电池策略、找某个文件再发送回终端。
本地PC访问GitHub时网络总是不稳定。
2、LLM模型
LLM模型能力是基础,是能力上限;决定推理质量、判断深度、表达能力。
Agent工作质量有区别,复杂任务——多步骤推理、跨系统操作、处理非标准场景——模型能力差距非常明显。
费用易超标:Agent大量消耗Token,一次对话对应十万级别;大模型API包月比较合适,如:Code Plan包月套餐。
每次Agent思考都是多轮推理:一个简单的任务可能触发5-10次API调用
上下文、记忆系统等会注入Prompt,增加每次请求的输入token
LLM聊天是一次对话和一次token调用,但Agent会是百倍千倍token调用
3、人机协作
人类作为领导角色,制定目标,拆解任务和安排角色,评判结果质量和提供改进建议,避免Agent生产垃圾。
外挂大脑:个人知识库,个人数据库
能干活:个人技能包Skills库,将成为新AppStore
懂你:个人记忆图谱:零散、片段、多媒体(文本、链接、图片、音频、视频等)
特点:随时积累、Agent可直接用、可迁移到未来AI
以前必须是生产出结构化的数字形式,电脑才能高效处理;现在用自然语言和丢个链接即可自动生成数字资产,效率不可同日而语。
Agent可代替部分App,聊天界面代替GUI,直接自然语言交互。
OpenClaw比豆包手机巧妙在于,没有直接触碰到大厂的利益。
OpenClaw现在就像安卓,大厂都在跟进,大厂必然会推出自己的AgentOS。
4、Tips
目前是初级版本,不要安装在常用电脑,因为可能要经常重新安装。从1个Agent开始,跑顺再加新Agent。
安装软件组件需要执行多个命令行指令,有些会报错,不能轻易解决,Agent能根据报错帮你解决问题、能自己执行命令行,跨过巨大门槛、非常省事。
查看网页会自动找选择框进行条件筛选,自主性较强。
如果某个工具不能实现任务,会自动更换其他工具,比较结果导向。
LLM可能会犯错,偶尔需要确认一下结果。需要记住的可能没记住,需要手工确认一下。
OpenClaw知道一些自己的工作步骤,但是在深入和细节的部分会有幻觉,应该是LLM的问题。让OpenClaw干活就行,如何做的细节不要刨根问底,LLM可能会胡说八道,对于错误只需要告诉正确的方法就行;建议使用DeepSeek的深度思考+智能搜索告诉OpenClaw版本号和问题来进行解决。
显性化的指令容易触发记忆规则去执行,隐性未指明的指令容易忘记规则。否则感觉像记不住规则,其实不是记不住的问题,是未命中对应的指令。
干活流程会生成Python代码,这些是临时的,需要人工要求保存脚本。
Agent看不到当前聊天记录的内容(包括引用聊天记录时),为避免丢失上下文,使用 "接上一条" + 简单概括方式让Agent能理解上下文。另外,跟Agent说“开始一个新话题”,避免上下文混乱。
建立特定任务的指令集
重复性的任务,优化无错误后把工作步骤变成本机能力,后续可以发起明确指令。
复杂任务步骤、犯错的教训、关键决策要主动让Agent记住成为任务流程,避免后续未按之前执行和再犯错。
人机共享工具
Obsidian知识库:文字、图片等分类信息;沉淀内容。
SQLite数据库:保存大量结构化数据信息
三、安装部署
Mac用户只需几步:
# 1. 安装Homebrew(如果未安装)https://github.com/Homebrew/brew/releases 下载Homebrew.pkg# 2. 安装trash(安全删除工具)brew install trash# 3. 安装OpenClawcurl-fsSL https://openclaw.ai/install.sh|bash# 4. 设置环境变量echo 'export PATH="/usr/local/opt/node@22/bin:$PATH"' >> ~/.zshrcsource ~/.zshrc
在飞书开放平台创建应用,开启机器人能力,配置事件订阅
添加权限:im:message、im:chat、contact:user.base:readonly等
运行openclaw pairing approve feishu <配对码>,完成配对
飞书,作为一个办公IM产品,恰好,文档、表格、日历、审批、知识库、多维表格,全是云端结构化数据,全在一个体系里,全有API。
但是慎用飞书官方插件,可能有Bug。
配置模型:我目前使用了MiniMax的Token Plan包月49元套餐。新版本已经支持了DeepSeek、Qwen、Xiaomi。
添加Skills:summarize、skill-vetter、github、scrapling-official。目前Scrapling有些不稳定,有时Playwright比较好用。
内置的Tavily Search需要提前注册API Key。
内置Obsidian本地Markdown笔记库,需要开启 obsidian CLI 工具,Perferences-关于-高级-命令行界面,开启;同时需要配置 Obsidian Vault 的路径,在workspace建立软链接:ln -s Obsidian目录 obsidian-vault。
clawhub 会碰到Rate limit exceeded!GitHub API 速率限制。需要登录clawhub login,打开浏览器授权。
四、核心功能:记忆+任务
1、记忆
这是我最关注的点。OpenClaw本身没有持久记忆,因为大脑的LLM没有记忆。
MEMORY.md需要明确把任务记录进去,如果有人说”记住这个”,就写下来。
上下文的记忆优先级比较高,因为大量上下文注入了token,记忆主要依赖上下文。但是新会话时也可能记不住,因为记忆按关键词匹配查找,必须相同的词并且大小写敏感。
/new 可以重新发起会话,能够重新载入记忆,可以尝试。但重启Gateway不会重新读取记忆。
我目前对OpenClaw的记忆不太满意,如果需要记忆更好,需要开启语义理解记忆或者安装其他记忆模块。
2、workspace智能体工作区
OpenClaw依赖Node启动,Node允许权限即可有完整文件权限,亦可删除gateway服务。Mac会弹出Node使用权限提示,是否允许。
工作区的标准文件:
AGENTS.md 工作手册:记忆规则、文件结构、工作流程
智能体的操作指南以及它应该如何使用记忆。
在每个会话开始时加载。
适合放置规则、优先级和”如何行为”的详细信息。
SOUL.md 性格和行事准则
人设、语气和边界。
每个会话加载。
USER.md 你是谁:名字、职业、工作时间、沟通偏好
用户是谁以及Agent如何称呼你。
每个会话加载。
IDENTITY.md Agent名字和形象
智能体的名称、风格和表情符号。
在引导仪式期间创建/更新。
TOOLS.md
关于本地工具和惯例的注释。
不控制工具可用性;仅作为指导。
HEARTBEAT.md
可选的心跳运行小型检查清单。
保持简短以避免 token 消耗。
BOOT.md
当启用内部 hooks 时,在 Gateway 网关重启时执行的可选启动检查清单。
保持简短;使用 message 工具进行出站发送。
记忆文件(Markdown)
memory/YYYY-MM-DD.md
每日记忆日志(每天一个文件)。
会话开始时读取今天 + 昨天的内容。
MEMORY.md(可选)
精选的长期记忆。
仅在主私密会话中加载(不在共享/群组上下文中加载)。
skills/(可选)
工作区特定的 Skills。
我的AGENTS.md
Red Lines
绝不泄露隐私、资金消费情况。
删除文件必须用 trash 命令,禁止用 rm、delete。trash 命令已通过brew install trash安装。
禁止运行 sudo 开头的命令。
不删除 workspace 以外的文件。
遇到不确定的事情,必须先跟我确认。
不确定范围的操作先问我,不自己决定。
遇到执行本机命令、删文件等可能增大本机风险的情况,需要我明确说“可以执行”。
禁止删除或停止openlaw.gateway服务
不要自行重启openlaw.gateway服务,需要重启时告诉我,让我来重启
安装新 skill 的时候,自动使用 skill-vetter 进行检查,审查通过再安装
3、复杂任务怎么用?
有固定的逻辑和流程,使用脚本。需要一点泛化能力,使用 skill。需要创造性和复杂推理,使用 Agent,它可以自行查找解决办法去执行任务。
要一点儿一点儿教,描述不全或者做错的东西,聊多了才清楚和做正确,有了完整具体的要求再加上持续的改正,龙虾就能干好活了。
工作任务要制定评估标准,可以持续循环迭代。评估标准可以让Agent参考文档生成。让Agent主动拆解任务或对拆解做提问,比如:怎么理解目标、应该分哪些步骤执行、每个步骤解决什么问题。
大模型有强烈的“马上就完成任务”的倾向,让Agent对任务做假设驱动,对复杂任务同时做场景驱动。先让它分析、假设、验证,再执行。
Agent经常自作主张,有强烈的完成任务感觉,即使没按要求。这是可以完成未知任务的两面性。
**你自认为清楚的任务是陷阱,以为自己清楚了,实际上写出来还是模糊的任务,所以LLM也是糊涂的,也只能猜着干。细节完备和逻辑清晰是最好的,或者提供一个足够的清晰参考。例如:你说多Agent,它认为subagent也是多Agent。
多Agent可以协作,但sessions_send不稳定,并且协作规则占用一些记忆空间,还是参考其他人使用文件规则做简单协作比较好。
优质可靠的数据源也很重要,仅靠搜索能找到的信息是有限的。
使用例子:比如你说"帮我整理一下上周的会议记录",它会:
读取相关文件
理解内容
提取要点
按格式整理
保存到笔记库
比如你说"检查今天关注的股票有没有发公告",它会:
读取股票列表
抓取交易所公告页面
匹配关注的股票
下载PDF报告
汇总结果发给你
我目前OpenClaw的任务能力如下:
Tavily全网搜索
skill-vetter检查
Obsidian读取和写入
Playwright、Scrapling查看网页(支持反爬)
SQLite数据库操作
读取pdf、csv:pdfplumber — 提取文本和表格
xmind操作:参考文件规范
定期清理临时文件
OpenClaw的失败案例
自行重启gateway失败,Gateway挂掉需要重新安装
新建自用skill,加载到系统中挂掉
更新上下文讨论的内容,我说“更新”,结果用内容把MEMORY.md覆盖了,自己还不知道删除了什么东西,幸好有备份
4、风险提示
安全风险:恶意Skill可能盗取API Key或误删文件,安装新技能前建议安全审查
费用风险:Agent消耗Token比普通对话多得多,建议设置日预算上限($10/天足够)
误操作风险:重要操作前确认,避免不可逆后果
数据风险:记得定期备份workspace、配置文件、定时任务
五、写在最后
我的感受是:如果完善了记忆,就能真正持续成长,成为7x24小时上班的AI数字员工。因为我重建MEMORY.md后,它又失忆了!
夜雨聆风