谈谈OpenClaw对Agent工程的启发

从ClawdBot刚出来的时候，也就是一月份的时候，就开始自己摸索了，也一直在和业界的朋友讨论，一直到昨天还在讨论OpenClaw的硬件的一个产品。

先说下自己实践的几个阶段哈

第一个阶段：尝尝鲜

ClawdBot刚出来后那段时间，我自己在本地MacBook做了安装，🦞 OpenClaw 2026.1.30 (76b5208)，怎么安装的我就不讲了，网上一大堆资料，我当时接的是Qwen的模型，并且对接上了飞书的插件，快速做了一个小任务，例如“读取优衣库销售数据.xlsx文件并提取前十条数据，创建一个飞书表格，把数据塞进去”，见下图。

说实话，这个任务很简单，但是一直在报错

详细的截图很长，我就不截取了，简单说是搞了挺久才在飞书中正确完成了操作。

然后我又尝试了一个简单的任务是通过飞书发送消息给某个人，配置了一大堆权限，还是一直在报错，废了半天劲才弄好。

也顺带试了一下浏览器的操作，分析一个数据仪表盘的数据：

第一个阶段做完，我的第一个判断是这就是个开源的manus（btw小札刚花了这么多钱买manus感觉很亏啊），我最后得到几个结论是

1、这玩意太蠢了，难道是我基模的问题，复杂一点的事情就搞不定了。

2、这个玩意要在本地运行，因为他更大的价值是操作本地环境和社交软件打通。

3、操作浏览器，这个不错，以后我读取数据不用做系统API打通了，可以模拟人来操作。

当时还在公司内部写了一个文章，结合内部业务场景，有哪些可以借鉴的，详细文章比较敏感，简单的说下几个关键点：

1、运营人员存在大量的本地文件，OpenClaw能够直接操作你的电脑，如执行 Shell 命令、管理文件、控制浏览器等，帮助用户完成本地操作；

2、将不再需要和各类内部系统打通，可以使用用户身份，直接操作用户浏览器，例如读取风神数据，读取CRM数据，进行卖点投放等。

3、持久化记忆，通过本地文件系统实现长期记忆，让 AI 越用越懂你。

然后就看到各个云平台开始陆陆续续出OpenClaw的部署产品，当我看到这些宣传的时候，我的回复是

第二个阶段：折腾各种部署环境

我本身做了很多年的数据和安全业务，当我在本地MacBook体验OpenClaw后，我的第一反应就是这玩意风险太大了，相当于把电脑权限托管给他了，因此我不能在我本地用，必须要用一个“沙箱”，差不多同时间，网上也可以陆续出现OpenClaw安全漏洞的问题。

我先后选了几个方案

1、阿里云-轻量服务器-国内-默认安装OpenClaw，操作系统我选择的是ubuntu

结论：不好，国外模型访问不了，还有Relay插件不稳定，很麻烦，还要自己装GNOME或KDE。

2、阿里云-无影云电脑-国内-还是选的ubuntu，感觉访问不了国外还是很麻烦，而且国内服务器，我之前用过Anthropic账号，很快就会被封。

3、阿里云-轻量服务器-美国，操作系统我还是选择的是ubuntu，但是什么都不安装。

装好系统后，我直接先安装了Claude Code，然后让Claude Code帮我安装了OpenClaw和GNOME，以及乱七八糟的配置和插件，一顿操作后可以顺利访问了。远程访问我用的是NoMachine，现在还一直运行稳定。

同时根据网上的建议，把一些基础的Skill安装好，包括

✅ gog

✅ tavily-search

✅ summarize

✅ find-skills

✅ notion

✅ nano-pdf

✅ todoist

✅ spotify-player

✅ sonoscli

✅ nano-banana-pro

✅ obsidian

✅ obsidian-ontology-sync

✅ self-improving

✅ proactive-agent-lite

✅ proactive-agent-skill

安装完成后，简单测试一下可以正常工作，同时我给OpenClaw起了个名字叫Eurake。

第三个阶段：开始真正体验

从简单到复杂，尝试了几个任务

1、Task1：订阅最新的AI咨询

2、Task2：替代我手工下载简历，自动登录QQ邮箱，批量下载简历

之前在BOSS上发布了几个职位，留的邮箱是我自己的个人邮箱，每次需要登录QQ邮箱，手动点击下载简历，感觉还是蛮麻烦的，特别是收到的简历非常多的时候，非常浪费时间，我想这个任务让Eurake试试

中间遇到了一些问题，例如API限流、relay插件需要手工点击、Anthropic的账户提示没钱了，逐个搞定后，就可以正常下载了，见下图

指的一提的是，Eurake不仅在执行我给的任务，他也在思考有没有更优的方案，见下图

3、Task3：帮我生成一个本地简历管理平台

我输入提示词，同时让Eurake帮我再想想探索些其他功能

我采纳了Eurake给我的部分功能建议和技术选型建议，确认好功能清单后开始进行开发，因为我本地安装了claude code，显性提示了Eurake用cc开发。

开发完成后，经过一两次小功能的微调，真正可用了，效果见下图

整个过程大概在1h左右，其中在Eurake生成代码的时候，我就去处理别的事情了，最后我把github的key告诉Eurake，让他给我保存下代码。

OpenClaw的原理解析

通过这张架构图，我们可以清晰地看到 Claw 系设计的四个核心层次：

1、入口 (Entry Points)

最关键的差异点：入口不是一个新的 App，而是你已经在高频使用的 WhatsApp、Telegram、Slack 或飞书。它潜入你的生活流，而不是强迫你迁移到新平台。

2、控制平面 (Control Plane)

这是系统的 “大脑中枢”。必须有一个 Gateway 或 Daemon 进程常驻运行，负责连接不同平台、路由消息、管理会话状态以及实施权限控制。

3、执行环 (Agent Loop)

这不仅是一句 Prompt，而是一套完整的工程闭环：从 “上下文理解” 到 “模型推理”，再到 “工具调用”，最后 “结果反馈”。这是一个不断循环、自我修正的自动化过程。

4.、身份与记忆 (Files)

SOUL / AGENTS / IDENTITY / MEMORY。这是 Claw 系的灵魂所在。通过文件化的人格与记忆，AI 不再是无状态的问答机，而是一个有性格、有记忆、懂偏好的长期伙伴。

入口即存量：Claw 系成功的关键在于 “入口不是新 App”。它利用了现有的IM生态，零摩擦地进入了用户的核心工作流。用户不需要下载新软件，不需要学习新 UI，只需要像发微信一样与AI协作。

为什么这么火：根源不是 “又一个 Agent 框架”

如果要深究 Claw 系为什么会在如此短的时间内引爆全网，我们不能仅仅把它归结为 “又一个 Agent 框架”。它的成功是多重因素叠加的结果，可以将其拆解为三个关键的 “拐点”：

1、体验拐点：从 “聊天” 变成 “通讯录里的同事”。传统 ChatGPT/Claude 的路径是：打开网页 → 新建对话 → 复制上下文。这是一种低频、断裂的体验。在群里 @ 它，像同事一样接单，发一句指令，变成常驻自动化。

2、工作流拐点：从 “问答” 到 “执行”。爆火的内容从来不是 “它答得多聪明”，而是 “它真的帮我做了事”。人们转发是因为它提供了实打实的效率收益。它可以自动整理、追踪、提醒，连接 GitHub、邮件、日程。

3、传播拐点：开源 + 可复刻 + 强故事，短视频里充斥着 “我把自己替换掉了” 的演示。这种传播具备三个极强的病毒式特征：开源：所有人都能跟着做；可复刻：几十分钟内跑通；强故事：真实成果比辞藻更有力。

Claw 系爆火的根源在于触达方式（通讯录常驻）与执行能力（自动化闭环）的结合，而不是单纯作为 “又一个 agent loop” 的技术创新。

SOUL.md / MEMORY.md：让助手 “长期运转” 的关键

很多人第一次运行 OpenClaw 或 NanoBot 时，最令他们震撼的往往不是复杂的工具调用，而是工作区里那几个看似朴素的 Markdown 文件。这些文件构成了 AI 的 “人格架构”，是它能从一个简单的 ChatBot 进化为长期 Assistant 的关键。

SOUL.md：人格与价值观；解决问题：同一件事反复问，风格不稳定。不同时间/通道，回复语气发生漂移。理解：把 “人格” 从会话中抽离，作为长期版本管理对象。
AGENTS.md：行为规则与 SOP；解决问题：工具很多，但模型不按你的方式用。任务缺乏固定流程（如先澄清、再计划）。理解：把它当做 AI 的 “员工手册” 或 SOP 文档。
IDENTITY.md：偏好与边界；解决问题：默认语言（中文/英文）与详略偏好。哪些事绝对不能做（隐私/合规边界）。理解：明确服务对象，定制个性化体验边界。
MEMORY.md：长期事实；解决问题：你是谁、你的项目、你的常用术语。把 “长期事实” 从临时会话中持久化。理解：这是实现 “越用越懂你” 的核心数据层。

不同项目对 MEMORY 的实现路径不同，这里提供一个简单的选型对比：

实现方案	优点	缺点
Markdown 纯文本	直观、可读、Git 可审计	上下文窗口占用大，检索弱
SQLite + FTS5 + 向量	可检索、轻量、可扩展	引入了额外的数据库依赖
PostgreSQL + pgvector	生产级、高并发、强事务	运维重，部署成本高

对比：Claw 系 vs Claude Code

在技术社区中，一个常见的问题是：“这和 Claude Code 有什么区别？”。这是一个非常关键的问题，虽然它们都使用了强大的模型，但在工程目标上有着本质的不同。

Claude Code：面向软件工程的 Agent 工作台。核心目标是帮你在代码仓库里完成具体的开发任务（读写代码、运行命令、修复 Bug）。它活在你的终端和 IDE 里。
Claw 系 (OpenClaw 等)：面向个人工作流的 Agent 控制平面。核心目标是帮你处理真实世界的沟通与事务（消息、日程、提醒、跨应用协作）。它活在你的通讯录和生活流里。

它们融合吗？会，也不会。你已经能看到像 NanoClaw 这样的变体尝试把 Claude Agent SDK 当作底层的执行内核。这意味着，框架本身极其轻量，大部分功能（如新增一个通信渠道）是通过让 Claude Code 直接重写框架自身代码来实现的。但即便底层执行复用，产品形态仍会分叉：开发者依然需要 “IDE 内的强执行”，而普通用户依然需要 “通讯录里的助理”。这两个场景的需求差异决定了它们将长期并存。

怎么选Claw系

项目	你会喜欢它的原因	你可能会踩坑的点	适合谁
OpenClaw	产品栈完整、多端多通道、生态强	复杂度高、运行成本更高	想要 “直接用起来” 的人
NanoBot	代码短、可读、研究友好	工程能力上限（记忆/生态）看实现	想学习/二开/快速验证
PicoClaw	Go 单二进制、低资源、部署爽	功能完整度取决于版本阶段	想跑在 SBC/旧机器的人
ZeroClaw	trait-driven、可插拔、像 runtime OS	需要理解配置/trait 思维	想做平台底座的人
NullClaw	极致小、vtable、沙箱后端 auto	Zig 生态门槛	想要极致轻量与强边界
NanoClaw	容器隔离、代码小到能审计	更偏 “AI-native 改代码”	强安全诉求的个人用户
IronClaw	能力权限、审计友好、生产级存储	依赖 PostgreSQL/pgvector，运维重	企业/团队场景

你想立刻用起来吗？如果是，不要犹豫，直接选择 OpenClaw。它是目前最成熟、最接近即插即用产品的选择。
你想读懂源码并做二次开发吗？如果是，选择 NanoBot 或 NanoClaw。它们的代码库足够精简，适合作为学习与魔改的脚手架。
你追求极致轻量或资源受限吗？如果是（比如跑在树莓派或旧机器上），看看 PicoClaw（Go）、ZeroClaw （Rust）或 NullClaw（Zig）。
你对安全隔离有极高要求吗？如果是，请转向 NanoClaw（容器隔离）或 IronClaw（企业级审计）。

回到文章开头Claw给我们什么启发

Claw 系之所以能席卷开发者社区，根本原因不在于它发明了什么惊天动地的模型能力。它成功的本质，在于通过巧妙的工程设计，将 AI 的形态从一个冷冰冰的 “聊天框里的回答者”，变成了一个你可以随时触达、值得信赖的 “通讯录里的执行者”。

而 SOUL.md / AGENTS.md / IDENTITY.md / MEMORY.md 这套 “可版本化的身份与记忆” 体系，赋予了它长期运转的灵魂；再叠加多通道触达带来的便利性与自动化闭环带来的生产力解放，最终形成了这股不可忽视的技术浪潮。