AI Agent的划时代产品-OpenClaw龙虾

LLM的DeepSeek成为划时代产品后，我一直在等能帮我干活的AI，等了一年它来了。3月份OpenClaw火了，我用了一段时间后发现：这玩意儿真能干活。

它和LLM的AI有什么区别？

LLM AI（ChatGPT、豆包等）：主要是获取知识和信息，代替搜索引擎

你问它答，不问不答
只能给文字回答，无法帮你操作

OpenClaw：

24小时待命，一直在线
能操作电脑、读写文件、发送消息、跑脚本
有长期记忆，能记住你说过的事
不仅给答案，还帮你把事情做完

Agent能够完成从未被编程、从未被预设的任务，纯粹靠通用问题解决能力加上对本地电脑的访问权，直接创造出解决方案。

从回答问题和写代码，变成自行安装软件并写代码完成任务，能直接给到结果，不是一个中间态，因为中间态在普通人那里后续可能会卡住而得不到结果。

Agent重点功能是记忆、任务流程、脚本；就是能记住怎么干活，保持灵活性的同时还能通过脚本代码做标准化和固化。

简单的任务Agent一次性就能做好流程和脚本，复杂的需要几轮对话教一下。需要注意，Agent主要依靠上下文和LLM来理解+分解+执行任务，可能每次都不一样，可能会忘记之前的错误和指导。先让Agent自己跑任务流程，再指导优化流程，流程完整没有错误后再编写代码，让Agent记住触发词，后续执行此任务就可以使用代码。

所以要想真正干好活，更依赖我们想清楚需要什么并且可以评估好坏，描述不全就要一点一点教，有了完整具体的要求再加上持续的改正，Agent就能干好活了。

一、OpenClaw能做什么？

📁 文件与数据处理

批量读写、整理文件
操作Obsidian笔记库
抓取微信公众号文章保存到本地
处理PDF、CSV、Xmind等格式

🔍 信息收集

全网搜索、深度抓取网页、信息调研
追踪GitHub Issues、自动修复Bug
抓取微信公众号/小红书/知乎等内容

🛠 开发者工作流

操作GitHub、建立网站
写代码、改代码、审代码
安全审计、节点诊断

☁ 办公集成

飞书文档、云盘、知识库操作、多维表格读写
发送邮件、发送IM消息
翻译、生成方案、编辑文章、媒体发布、生成图片视频

⏰ 自动化

定时任务（cron）
多步骤工作流
子Agent并行/串行执行

📅 日常助手

查天气、记日志
维护记忆、安排提醒
批量发送消息

核心优势是工具组合——比如"抓取网页 → 提取关键信息 → 存到笔记库 → 提醒你"这种一条龙服务。

Agent基于LLM的擅长能力：分解执行任务、写脚本、执行CLI和API。

二、OpenClaw优势

24小时运转的持续存在，不只是一问一答的触发模式。

能干活：不只是回答问题，不是工具，而是完成任务，能交付结果
有记忆：长期记忆，文件记录持久记忆
自动生成Skills：Github开源代码变成Skills，自己写Python代码执行任务，自动查找Skills并使用，Agent可共享Skills
跨域操作：微信公众号、飞书表格、小红书、App（日历、笔记、IM渠道，无需登录认证）、文件仓库
跨信息格式处理Human2Agent：文本文章<-->Markdown、写Python代码、把人类的经验和知识通过Skills和知识库注入Agent变成数字资产
Agent协同：本地文件信息交换、定时任务触发；沟通损耗几乎为0，知识和技能传递成本几乎为0
复杂任务：

未提前训练任务：完成从未被编程、从未被预设的任务，纯粹靠通用问题解决能力加上对本地电脑的完全访问权，即刻创造出解决方案

目标结果的任务分解与执行，任务流程和踩坑经验可固化为Skills持续迭代

脑子里面的知识和经验可以变成Skills的数字资产

主动性：心跳heartbeat.md里面记着待办任务和周期性提醒（让Agent检查一下有没有事情可以做，提醒事项有活人感），完成未知任务（给建议->替我执行）
代替App：无需UI界面操作（API、CLI、MCP）

不是工具，是有记忆、有经验、能持续成长、7x24小时上班的AI数字员工。

告诉需求，直接提供成果，Agent自己搞定中间的环境、配置、代码。

1、部署方式区别

云端部署与Manus基本没有区别。

本地电脑可以读用户桌面上的所有文件，帮用户清理磁盘、调整电池策略、找某个文件再发送回终端。

本地PC访问GitHub时网络总是不稳定。

2、LLM模型

LLM模型能力是基础，是能力上限；决定推理质量、判断深度、表达能力。

Agent工作质量有区别，复杂任务——多步骤推理、跨系统操作、处理非标准场景——模型能力差距非常明显。

费用易超标：Agent大量消耗Token，一次对话对应十万级别；大模型API包月比较合适，如：Code Plan包月套餐。

每次Agent思考都是多轮推理：一个简单的任务可能触发5-10次API调用
上下文、记忆系统等会注入Prompt，增加每次请求的输入token
LLM聊天是一次对话和一次token调用，但Agent会是百倍千倍token调用

3、人机协作

人类作为领导角色，制定目标，拆解任务和安排角色，评判结果质量和提供改进建议，避免Agent生产垃圾。

外挂大脑：个人知识库，个人数据库

能干活：个人技能包Skills库，将成为新AppStore

懂你：个人记忆图谱：零散、片段、多媒体（文本、链接、图片、音频、视频等）

特点：随时积累、Agent可直接用、可迁移到未来AI

以前必须是生产出结构化的数字形式，电脑才能高效处理；现在用自然语言和丢个链接即可自动生成数字资产，效率不可同日而语。

Agent可代替部分App，聊天界面代替GUI，直接自然语言交互。

OpenClaw比豆包手机巧妙在于，没有直接触碰到大厂的利益。

OpenClaw现在就像安卓，大厂都在跟进，大厂必然会推出自己的AgentOS。

4、Tips

目前是初级版本，不要安装在常用电脑，因为可能要经常重新安装。从1个Agent开始，跑顺再加新Agent。

安装软件组件需要执行多个命令行指令，有些会报错，不能轻易解决，Agent能根据报错帮你解决问题、能自己执行命令行，跨过巨大门槛、非常省事。

查看网页会自动找选择框进行条件筛选，自主性较强。

如果某个工具不能实现任务，会自动更换其他工具，比较结果导向。

LLM可能会犯错，偶尔需要确认一下结果。需要记住的可能没记住，需要手工确认一下。

OpenClaw知道一些自己的工作步骤，但是在深入和细节的部分会有幻觉，应该是LLM的问题。让OpenClaw干活就行，如何做的细节不要刨根问底，LLM可能会胡说八道，对于错误只需要告诉正确的方法就行；建议使用DeepSeek的深度思考+智能搜索告诉OpenClaw版本号和问题来进行解决。

显性化的指令容易触发记忆规则去执行，隐性未指明的指令容易忘记规则。否则感觉像记不住规则，其实不是记不住的问题，是未命中对应的指令。

干活流程会生成Python代码，这些是临时的，需要人工要求保存脚本。

Agent看不到当前聊天记录的内容（包括引用聊天记录时），为避免丢失上下文，使用 "接上一条" + 简单概括方式让Agent能理解上下文。另外，跟Agent说“开始一个新话题”，避免上下文混乱。

建立特定任务的指令集

重复性的任务，优化无错误后把工作步骤变成本机能力，后续可以发起明确指令。

复杂任务步骤、犯错的教训、关键决策要主动让Agent记住成为任务流程，避免后续未按之前执行和再犯错。

人机共享工具

Obsidian知识库：文字、图片等分类信息；沉淀内容。

SQLite数据库：保存大量结构化数据信息

三、安装部署

Mac用户只需几步：

# 1. 安装Homebrew（如果未安装）https://github.com/Homebrew/brew/releases 下载Homebrew.pkg# 2. 安装trash（安全删除工具）brew install trash# 3. 安装OpenClawcurl-fsSL https://openclaw.ai/install.sh|bash# 4. 设置环境变量echo 'export PATH="/usr/local/opt/node@22/bin:$PATH"' >> ~/.zshrcsource ~/.zshrc

配置飞书机器人：

在飞书开放平台创建应用，开启机器人能力，配置事件订阅
添加权限：im:message、im:chat、contact:user.base:readonly等
运行openclaw pairing approve feishu <配对码>，完成配对

飞书，作为一个办公IM产品，恰好，文档、表格、日历、审批、知识库、多维表格，全是云端结构化数据，全在一个体系里，全有API。

但是慎用飞书官方插件，可能有Bug。

配置模型：我目前使用了MiniMax的Token Plan包月49元套餐。新版本已经支持了DeepSeek、Qwen、Xiaomi。

添加Skills：summarize、skill-vetter、github、scrapling-official。目前Scrapling有些不稳定，有时Playwright比较好用。

内置的Tavily Search需要提前注册API Key。

内置Obsidian本地Markdown笔记库，需要开启 obsidian CLI 工具，Perferences-关于-高级-命令行界面，开启；同时需要配置 Obsidian Vault 的路径，在workspace建立软链接：ln -s Obsidian目录 obsidian-vault。

clawhub 会碰到Rate limit exceeded！GitHub API 速率限制。需要登录clawhub login，打开浏览器授权。

四、核心功能：记忆+任务

1、记忆

这是我最关注的点。OpenClaw本身没有持久记忆，因为大脑的LLM没有记忆。

MEMORY.md需要明确把任务记录进去，如果有人说”记住这个”，就写下来。

上下文的记忆优先级比较高，因为大量上下文注入了token，记忆主要依赖上下文。但是新会话时也可能记不住，因为记忆按关键词匹配查找，必须相同的词并且大小写敏感。

/new 可以重新发起会话，能够重新载入记忆，可以尝试。但重启Gateway不会重新读取记忆。

我目前对OpenClaw的记忆不太满意，如果需要记忆更好，需要开启语义理解记忆或者安装其他记忆模块。

2、workspace智能体工作区

OpenClaw依赖Node启动，Node允许权限即可有完整文件权限，亦可删除gateway服务。Mac会弹出Node使用权限提示，是否允许。

工作区的标准文件：

AGENTS.md 工作手册：记忆规则、文件结构、工作流程

智能体的操作指南以及它应该如何使用记忆。

在每个会话开始时加载。

适合放置规则、优先级和”如何行为”的详细信息。

SOUL.md 性格和行事准则

人设、语气和边界。

每个会话加载。

USER.md 你是谁：名字、职业、工作时间、沟通偏好

用户是谁以及Agent如何称呼你。

每个会话加载。

IDENTITY.md Agent名字和形象

智能体的名称、风格和表情符号。

在引导仪式期间创建/更新。

TOOLS.md

关于本地工具和惯例的注释。

不控制工具可用性；仅作为指导。

HEARTBEAT.md

可选的心跳运行小型检查清单。

保持简短以避免 token 消耗。

BOOT.md

当启用内部 hooks 时，在 Gateway 网关重启时执行的可选启动检查清单。

保持简短；使用 message 工具进行出站发送。

记忆文件（Markdown）

memory/YYYY-MM-DD.md

每日记忆日志（每天一个文件）。

会话开始时读取今天 + 昨天的内容。

MEMORY.md（可选）

精选的长期记忆。

仅在主私密会话中加载（不在共享/群组上下文中加载）。

skills/（可选）

工作区特定的 Skills。

我的AGENTS.md

Red Lines

绝不泄露隐私、资金消费情况。
删除文件必须用 trash 命令，禁止用 rm、delete。trash 命令已通过brew install trash安装。
禁止运行 sudo 开头的命令。
不删除 workspace 以外的文件。
遇到不确定的事情，必须先跟我确认。
不确定范围的操作先问我，不自己决定。
遇到执行本机命令、删文件等可能增大本机风险的情况，需要我明确说“可以执行”。
禁止删除或停止openlaw.gateway服务
不要自行重启openlaw.gateway服务，需要重启时告诉我，让我来重启
安装新 skill 的时候，自动使用 skill-vetter 进行检查，审查通过再安装

3、复杂任务怎么用？

有固定的逻辑和流程，使用脚本。需要一点泛化能力，使用 skill。需要创造性和复杂推理，使用 Agent，它可以自行查找解决办法去执行任务。

要一点儿一点儿教，描述不全或者做错的东西，聊多了才清楚和做正确，有了完整具体的要求再加上持续的改正，龙虾就能干好活了。

工作任务要制定评估标准，可以持续循环迭代。评估标准可以让Agent参考文档生成。让Agent主动拆解任务或对拆解做提问，比如：怎么理解目标、应该分哪些步骤执行、每个步骤解决什么问题。

大模型有强烈的“马上就完成任务”的倾向，让Agent对任务做假设驱动，对复杂任务同时做场景驱动。先让它分析、假设、验证，再执行。

Agent经常自作主张，有强烈的完成任务感觉，即使没按要求。这是可以完成未知任务的两面性。

**你自认为清楚的任务是陷阱，以为自己清楚了，实际上写出来还是模糊的任务，所以LLM也是糊涂的，也只能猜着干。细节完备和逻辑清晰是最好的，或者提供一个足够的清晰参考。例如：你说多Agent，它认为subagent也是多Agent。

多Agent可以协作，但sessions_send不稳定，并且协作规则占用一些记忆空间，还是参考其他人使用文件规则做简单协作比较好。

优质可靠的数据源也很重要，仅靠搜索能找到的信息是有限的。

使用例子：比如你说"帮我整理一下上周的会议记录"，它会：

读取相关文件
理解内容
提取要点
按格式整理
保存到笔记库

比如你说"检查今天关注的股票有没有发公告"，它会：

读取股票列表
抓取交易所公告页面
匹配关注的股票
下载PDF报告
汇总结果发给你

我目前OpenClaw的任务能力如下：

Tavily全网搜索
skill-vetter检查
Obsidian读取和写入
Playwright、Scrapling查看网页（支持反爬）
SQLite数据库操作
读取pdf、csv：pdfplumber — 提取文本和表格
xmind操作：参考文件规范
定期清理临时文件

OpenClaw的失败案例

自行重启gateway失败，Gateway挂掉需要重新安装
新建自用skill，加载到系统中挂掉
更新上下文讨论的内容，我说“更新”，结果用内容把MEMORY.md覆盖了，自己还不知道删除了什么东西，幸好有备份

4、风险提示

安全风险：恶意Skill可能盗取API Key或误删文件，安装新技能前建议安全审查
费用风险：Agent消耗Token比普通对话多得多，建议设置日预算上限（$10/天足够）
误操作风险：重要操作前确认，避免不可逆后果
数据风险：记得定期备份workspace、配置文件、定时任务

五、写在最后

我的感受是：如果完善了记忆，就能真正持续成长，成为7x24小时上班的AI数字员工。因为我重建MEMORY.md后，它又失忆了！

AI Agent前途无量！