乐于分享
好东西不私藏

谈谈OpenClaw对Agent工程的启发

谈谈OpenClaw对Agent工程的启发
从ClawdBot刚出来的时候,也就是一月份的时候,就开始自己摸索了,也一直在和业界的朋友讨论,一直到昨天还在讨论OpenClaw的硬件的一个产品。
先说下自己实践的几个阶段哈
第一个阶段:尝尝鲜
ClawdBot刚出来后那段时间,我自己在本地MacBook做了安装,🦞 OpenClaw 2026.1.30 (76b5208),怎么安装的我就不讲了,网上一大堆资料,我当时接的是Qwen的模型,并且对接上了飞书的插件,快速做了一个小任务,例如“读取优衣库销售数据.xlsx文件并提取前十条数据,创建一个飞书表格,把数据塞进去”,见下图。
说实话,这个任务很简单,但是一直在报错
详细的截图很长,我就不截取了,简单说是搞了挺久才在飞书中正确完成了操作。
然后我又尝试了一个简单的任务是 通过飞书发送消息给某个人,配置了一大堆权限,还是一直在报错,废了半天劲才弄好。
也顺带试了一下浏览器的操作,分析一个数据仪表盘的数据:
第一个阶段做完,我的第一个判断是这就是个开源的manus(btw小札刚花了这么多钱买manus感觉很亏啊),我最后得到几个结论是
1、这玩意太蠢了,难道是我基模的问题,复杂一点的事情就搞不定了。
2、这个玩意要在本地运行,因为他更大的价值是操作本地环境和社交软件打通。
3、操作浏览器,这个不错,以后我读取数据不用做系统API打通了,可以模拟人来操作。
当时还在公司内部写了一个文章,结合内部业务场景,有哪些可以借鉴的,详细文章比较敏感,简单的说下几个关键点:

1、运营人员存在大量的本地文件,OpenClaw能够直接操作你的电脑,如执行 Shell 命令、管理文件、控制浏览器等,帮助用户完成本地操作;

2、将不再需要和各类内部系统打通,可以使用用户身份,直接操作用户浏览器,例如读取风神数据,读取CRM数据,进行卖点投放等。

3、持久化记忆,通过本地文件系统实现长期记忆,让 AI 越用越懂你。

然后就看到各个云平台开始陆陆续续出OpenClaw的部署产品,当我看到这些宣传的时候,我的回复是
第二个阶段:折腾各种部署环境
我本身做了很多年的数据和安全业务,当我在本地MacBook体验OpenClaw后,我的第一反应就是这玩意风险太大了,相当于把电脑权限托管给他了,因此我不能在我本地用,必须要用一个“沙箱”,差不多同时间,网上也可以陆续出现OpenClaw安全漏洞的问题
我先后选了几个方案
1、阿里云-轻量服务器-国内-默认安装OpenClaw,操作系统我选择的是ubuntu
结论:不好,国外模型访问不了,还有Relay插件不稳定,很麻烦,还要自己装GNOME或KDE。
2、阿里云-无影云电脑-国内-还是选的ubuntu,感觉访问不了国外还是很麻烦,而且国内服务器,我之前用过Anthropic账号,很快就会被封。
3、阿里云-轻量服务器-美国,操作系统我还是选择的是ubuntu,但是什么都不安装。
装好系统后,我直接先安装了Claude Code,然后让Claude Code帮我安装了OpenClaw和GNOME,以及乱七八糟的配置和插件,一顿操作后可以顺利访问了。远程访问我用的是NoMachine,现在还一直运行稳定。
同时根据网上的建议,把一些基础的Skill安装好,包括

✅ gog

✅ tavily-search

✅ summarize

✅ find-skills

✅ notion

✅ nano-pdf

✅ todoist

✅ spotify-player

✅ sonoscli

✅ nano-banana-pro

✅ obsidian

✅ obsidian-ontology-sync

✅ self-improving

✅ proactive-agent-lite

✅ proactive-agent-skill

安装完成后,简单测试一下可以正常工作,同时我给OpenClaw起了个名字叫Eurake。

第三个阶段:开始真正体验
从简单到复杂,尝试了几个任务
1、Task1:订阅最新的AI咨询
2、Task2:替代我手工下载简历,自动登录QQ邮箱,批量下载简历
之前在BOSS上发布了几个职位,留的邮箱是我自己的个人邮箱,每次需要登录QQ邮箱,手动点击下载简历,感觉还是蛮麻烦的,特别是收到的简历非常多的时候,非常浪费时间,我想这个任务让Eurake试试
中间遇到了一些问题,例如API限流、relay插件需要手工点击、Anthropic的账户提示没钱了,逐个搞定后,就可以正常下载了,见下图
指的一提的是,Eurake不仅在执行我给的任务,他也在思考有没有更优的方案,见下图
3、Task3:帮我生成一个本地简历管理平台
我输入提示词,同时让Eurake帮我再想想探索些其他功能
我采纳了Eurake给我的部分功能建议和技术选型建议,确认好功能清单后开始进行开发,因为我本地安装了claude code,显性提示了Eurake用cc开发。
开发完成后,经过一两次小功能的微调,真正可用了,效果见下图
整个过程大概在1h左右,其中在Eurake生成代码的时候,我就去处理别的事情了,最后我把github的key告诉Eurake,让他给我保存下代码。
OpenClaw的原理解析

通过这张架构图,我们可以清晰地看到 Claw 系设计的四个核心层次:

1、入口 (Entry Points)

最关键的差异点:入口不是一个新的 App,而是你已经在高频使用的 WhatsApp、Telegram、Slack 或飞书。它潜入你的生活流,而不是强迫你迁移到新平台。

2、控制平面 (Control Plane)

这是系统的 “大脑中枢”。必须有一个 Gateway 或 Daemon 进程常驻运行,负责连接不同平台、路由消息、管理会话状态以及实施权限控制。

3、执行环 (Agent Loop)

这不仅是一句 Prompt,而是一套完整的工程闭环:从 “上下文理解” 到 “模型推理”,再到 “工具调用”,最后 “结果反馈”。这是一个不断循环、自我修正的自动化过程。

4.、身份与记忆 (Files)

SOUL / AGENTS / IDENTITY / MEMORY。这是 Claw 系的灵魂所在。通过文件化的人格与记忆,AI 不再是无状态的问答机,而是一个有性格、有记忆、懂偏好的长期伙伴。

入口即存量:Claw 系成功的关键在于 “入口不是新 App”。它利用了现有的IM生态,零摩擦地进入了用户的核心工作流。用户不需要下载新软件,不需要学习新 UI,只需要像发微信一样与AI协作。

为什么这么火:根源不是 “又一个 Agent 框架”

如果要深究 Claw 系为什么会在如此短的时间内引爆全网,我们不能仅仅把它归结为 “又一个 Agent 框架”。它的成功是多重因素叠加的结果,可以将其拆解为三个关键的 “拐点”:

1、体验拐点:从 “聊天” 变成 “通讯录里的同事”。传统 ChatGPT/Claude 的路径是:打开网页 → 新建对话 → 复制上下文。这是一种低频、断裂的体验。在群里 @ 它,像同事一样接单,发一句指令,变成常驻自动化。

2、工作流拐点:从 “问答” 到 “执行”。爆火的内容从来不是 “它答得多聪明”,而是 “它真的帮我做了事”。人们转发是因为它提供了实打实的效率收益。它可以自动整理、追踪、提醒,连接 GitHub、邮件、日程。

3、传播拐点:开源 + 可复刻 + 强故事,短视频里充斥着 “我把自己替换掉了” 的演示。这种传播具备三个极强的病毒式特征:开源:所有人都能跟着做;可复刻:几十分钟内跑通;强故事:真实成果比辞藻更有力。

Claw 系爆火的根源在于触达方式(通讯录常驻)与执行能力(自动化闭环)的结合,而不是单纯作为 “又一个 agent loop” 的技术创新。

SOUL.md / MEMORY.md:让助手 “长期运转” 的关键

很多人第一次运行 OpenClaw 或 NanoBot 时,最令他们震撼的往往不是复杂的工具调用,而是工作区里那几个看似朴素的 Markdown 文件。这些文件构成了 AI 的 “人格架构”,是它能从一个简单的 ChatBot 进化为长期 Assistant 的关键。

  • SOUL.md:人格与价值观;解决问题:同一件事反复问,风格不稳定。不同时间/通道,回复语气发生漂移。理解:把 “人格” 从会话中抽离,作为长期版本管理对象。

  • AGENTS.md:行为规则与 SOP;解决问题:工具很多,但模型不按你的方式用。任务缺乏固定流程(如先澄清、再计划)。理解:把它当做 AI 的 “员工手册” 或 SOP 文档。

  • IDENTITY.md:偏好与边界;解决问题:默认语言(中文/英文)与详略偏好。哪些事绝对不能做(隐私/合规边界)。理解:明确服务对象,定制个性化体验边界。

  • MEMORY.md:长期事实;解决问题:你是谁、你的项目、你的常用术语。把 “长期事实” 从临时会话中持久化。理解:这是实现 “越用越懂你” 的核心数据层。

不同项目对 MEMORY 的实现路径不同,这里提供一个简单的选型对比:

实现方案

优点

缺点

Markdown 纯文本

直观、可读、Git 可审计

上下文窗口占用大,检索弱

SQLite + FTS5 + 向量

可检索、轻量、可扩展

引入了额外的数据库依赖

PostgreSQL + pgvector

生产级、高并发、强事务

运维重,部署成本高

对比:Claw 系 vs Claude Code

在技术社区中,一个常见的问题是:“这和 Claude Code 有什么区别?”。这是一个非常关键的问题,虽然它们都使用了强大的模型,但在工程目标上有着本质的不同。

  • Claude Code:面向软件工程的 Agent 工作台。核心目标是帮你在代码仓库里完成具体的开发任务(读写代码、运行命令、修复 Bug)。它活在你的终端和 IDE 里。

  • Claw 系 (OpenClaw 等):面向个人工作流的 Agent 控制平面。核心目标是帮你处理真实世界的沟通与事务(消息、日程、提醒、跨应用协作)。它活在你的通讯录和生活流里。

它们融合吗?会,也不会。你已经能看到像 NanoClaw 这样的变体尝试把 Claude Agent SDK 当作底层的执行内核。这意味着,框架本身极其轻量,大部分功能(如新增一个通信渠道)是通过让 Claude Code 直接重写框架自身代码来实现的。但即便底层执行复用,产品形态仍会分叉:开发者依然需要 “IDE 内的强执行”,而普通用户依然需要 “通讯录里的助理”。这两个场景的需求差异决定了它们将长期并存。

怎么选Claw系

项目

你会喜欢它的原因

你可能会踩坑的点

适合谁

OpenClaw

产品栈完整、多端多通道、生态强

复杂度高、运行成本更高

想要 “直接用起来” 的人

NanoBot

代码短、可读、研究友好

工程能力上限(记忆/生态)看实现

想学习/二开/快速验证

PicoClaw

Go 单二进制、低资源、部署爽

功能完整度取决于版本阶段

想跑在 SBC/旧机器的人

ZeroClaw

trait-driven、可插拔、像 runtime OS

需要理解配置/trait 思维

想做平台底座的人

NullClaw

极致小、vtable、沙箱后端 auto

Zig 生态门槛

想要极致轻量与强边界

NanoClaw

容器隔离、代码小到能审计

更偏 “AI-native 改代码”

强安全诉求的个人用户

IronClaw

能力权限、审计友好、生产级存储

依赖 PostgreSQL/pgvector,运维重

企业/团队场景

  • 你想立刻用起来吗?如果是,不要犹豫,直接选择 OpenClaw。它是目前最成熟、最接近即插即用产品的选择。

  • 你想读懂源码并做二次开发吗?如果是,选择 NanoBot 或 NanoClaw。它们的代码库足够精简,适合作为学习与魔改的脚手架。

  • 你追求极致轻量或资源受限吗?如果是(比如跑在树莓派或旧机器上),看看 PicoClaw(Go)、ZeroClaw (Rust)或 NullClaw(Zig)。

  • 你对安全隔离有极高要求吗?如果是,请转向 NanoClaw(容器隔离)或 IronClaw(企业级审计)。

回到文章开头Claw给我们什么启发

Claw 系之所以能席卷开发者社区,根本原因不在于它发明了什么惊天动地的模型能力。它成功的本质,在于通过巧妙的工程设计,将 AI 的形态从一个冷冰冰的 “聊天框里的回答者”,变成了一个你可以随时触达、值得信赖的 “通讯录里的执行者”。

而 SOUL.md / AGENTS.md / IDENTITY.md / MEMORY.md 这套 “可版本化的身份与记忆” 体系,赋予了它长期运转的灵魂;再叠加多通道触达带来的便利性与自动化闭环带来的生产力解放,最终形成了这股不可忽视的技术浪潮。