AI 助手只会动嘴?这个开源项目让它真正"动手"干活
AI 助手只会动嘴?这个开源项目让它真正”动手”干活
10 天 13 万 Star,OpenClaw 正在重新定义”AI 助手”的能力边界
引子:一个真实的使用场景
周一早上 9 点,你坐在电脑前,对 AI 助手说:
“帮我整理一下上周的销售数据,生成个图表,然后发到团队群里。”
传统 AI(ChatGPT/Claude)的回答:
好的,我可以帮你完成这个任务。以下是操作步骤:1. 打开 Excel,找到销售数据文件2. 选中数据区域,点击"插入"→"图表"3. 选择合适的图表类型(建议柱状图或折线图)4. 调整图表样式和标题5. 保存文件6. 打开团队聊天软件,找到对应群组7. 上传文件并发送需要我详细解释某一步吗?
看起来很专业对吧?但问题是——它只给了你一份操作指南,什么都没做。你还得自己动手,一步步执行。
OpenClaw 的回答:
已完成!✅ 已定位文件:~/Documents/销售数据_2026W10.xlsx✅ 已生成图表:销售额趋势图(折线图)、各产品占比图(饼图)✅ 已保存到:~/Documents/销售报告_2026W10.pdf✅ 已发送到:钉钉 - 销售团队群查看报告:[文件路径]
它真的做完了——从找文件、分析数据、生成图表,到发送消息,全程不需要你动手。
这就是 OpenClaw 带来的范式革命:AI 助手从”动嘴”升级为”动手”。
一、OpenClaw 是什么?

官方定义
OpenClaw(中文名”AI 龙虾”)是一个本地优先的AI Agent 执行网关,由奥地利工程师 Peter Steinberger(PSPDFKit 创始人)发起并主导开发。
用大白话解释:
-
它不是一个新的 AI 模型(不像 GPT-4、Claude) -
它是一个给 AI 装上”手脚”的系统 -
它让 AI 能真正操作你的电脑、访问网络、控制软件、完成任务
核心定位对比
|
|
|
|
|
|---|---|---|---|
| 对话式 AI |
|
|
|
| Agent框架 |
|
|
|
| 执行网关 | OpenClaw | 听懂指令→直接做完→反馈结果 |
|
一句话概括:ChatGPT 是”军师”,只出主意不动手;OpenClaw 是”秘书”,不仅出主意,还帮你把事办了。
二、为什么 OpenClaw 这么火?
现象级增长数据
- 2025 年 11 月 24 日:
项目在 GitHub 提交第一行代码,初始名称为”Clawdbot” - 2026 年 1 月:
因商标问题更名为”Moltbot”(龙虾蜕壳之意) - 2026 年 1 月 30 日:
正式定名为”OpenClaw” - 2026 年初
:开源 10 天获得13 万 GitHub Star,成为 AI 智能体领域现象级产品
击中了什么痛点?
痛点 1:AI”能说不能做”
你有没有过这样的体验:
-
问 AI”怎么整理电脑文件”,它给你一堆步骤,你还是懒得动手 -
让 AI”帮我订个会议室”,它说”我无法访问你的日历系统” -
请 AI”把这个文件发给张三”,它回复”我没有发送文件的能力”
传统 AI 的能力断层:它能写出完美的代码,但不能帮你运行;它能给出详细的计划,但不能替你执行。
OpenClaw 解决的,就是这个”最后一公里”问题——让 AI 的输出从”文本”变成”结果”。
痛点 2:隐私焦虑
大多数 AI 助手需要把你的数据传到云端:
-
你和 AI 的对话记录 -
你上传的文件内容 -
你的操作习惯和偏好
这些数据存在哪里?谁在看?会不会泄露?你完全不知道。
OpenClaw 的选择:本地优先(Local-First)
-
所有数据存储在你的手机/电脑上 -
只有在调用云端大模型时才联网 -
支持切换为本地模型,实现零联网运行
数据主权交还用户——这是 OpenClaw 的核心设计哲学。
痛点 3:交互入口碎片化
想用 AI 助手?你得:
-
下载专门的 APP -
打开特定的网页 -
注册账号、登录、付费……
OpenClaw 的做法:无界面设计
你已经在使用微信、钉钉、飞书、Telegram 对吧?OpenClaw 直接嵌入这些你每天都在用的聊天软件里。
无需额外学习成本——就像跟同事发消息一样,顺手@一下 AI,下达指令,它就开干了。
三、OpenClaw 能帮你做什么?
场景 1:文件管理自动化

指令示例:
-
“把桌面所有超过一周的截图归档到 D 盘” -
“找出上个月修改过的所有 Word 文档,复制到备份文件夹” -
“清理下载文件夹里所有的.zip 和.rar 文件”
执行过程:
-
AI 扫描指定目录 -
按条件过滤文件(时间、类型、大小等) -
执行移动/复制/删除操作 -
生成操作日志,告诉你做了什么
安全机制:删除操作会二次确认,防止误删重要文件。
场景 2:浏览器自动化

指令示例:
-
“登录公司后台,导出今天的订单数据” -
“帮我在知乎搜索’AI Agent’,收藏点赞最高的 5 篇文章” -
“监控这个商品的价格,降到 3000 以下时通知我”
执行过程:
-
AI 自动打开浏览器,导航到目标网站 -
填写表单、点击按钮、提取数据 -
处理登录验证码(需人工协助) -
将结果保存为 Excel/CSV,或发送给你
技术原理:基于 Playwright/CDP(Chrome DevTools Protocol),但做了更高层的抽象,AI 不需要懂 CSS 选择器或异步加载。
场景 3:跨平台消息处理
指令示例:
-
“把钉钉收到的所有未读消息摘要,发到我的邮箱” -
“监测 Slack 里的关键词’紧急’,一旦出现就给我发短信” -
“每天下午 6 点,自动生成日报并发到团队群”
支持的平台:
-
即时通讯:WhatsApp、Telegram、Slack、Discord -
办公协作:钉钉、飞书、Microsoft Teams -
原生集成:iMessage(macOS 专属) -
协议支持:HTTP/WebSocket/MQTT 等
核心能力:一个网关,统一所有聊天入口,AI 不用关心消息从哪里来。
场景 4:代码开发与部署
指令示例:
-
“帮我把这个 Python 脚本改成异步版本” -
“在 GitHub 上创建一个新仓库,初始化 README 和.gitignore” -
“部署这个项目到 Vercel,配置好环境变量”
执行过程:
-
AI 读取项目代码 -
理解需求,生成修改后的代码 -
执行 git 命令(add/commit/push) -
调用部署 API,完成上线
安全机制:Git 操作需要授权,敏感信息(如 API Key)从安全配置中读取,不暴露给 AI。
场景 5:日程与会议管理
指令示例:
-
“帮我约张三明天下午 3 点开会,预定会议室 A” -
“查看我本周的日程,找出空闲时间段” -
“把下周的会议提醒提前 15 分钟通知我”
执行过程:
-
AI 访问你的日历系统 -
检查冲突,找到合适时间 -
创建会议邀请,发送给参会人 -
设置提醒,到点通知你
隐私保护:日历数据本地存储,不会上传到第三方。
四、OpenClaw 是如何做到的?
核心架构:三层设计
┌─────────────────────────────────────┐│ Layer 3: LLM 大模型层(智能大脑) ││ GPT-4 / Claude / 通义千问 / 本地模型 │└─────────────────┬───────────────────┘ ↓┌─────────────────────────────────────┐│ Layer 2: Gateway 网关层(神经中枢) ││ 会话管理 | 消息路由 | 记忆系统 | 权限控制│└─────────────────┬───────────────────┘ ↓┌─────────────────────────────────────┐│ Layer 1: Channels 渠道层(交互入口)││ 微信/钉钉/飞书/Telegram/Slack/... │└─────────────────────────────────────┘
通俗理解:
- 渠道层
= 耳朵和嘴巴(接收消息、发送回复) - 网关层
= 大脑皮层(理解意图、规划任务、控制权限) - 大模型层
= 大脑核心区(逻辑推理、决策判断)
关键创新:执行抽象层(EAL)
这是 OpenClaw 最核心的技术突破。
传统做法:AI 直接写系统命令
# ❌ 危险:AI 直接生成 Shell 命令rm -rf ~/Desktop/*.pngmv ~/Desktop/* /tmp/backup
风险:
-
Windows/macOS/Linux命令不同,AI 容易搞错 -
可能被恶意注入危险命令 -
无法统一权限控制和审计
OpenClaw 的做法:AI 生成标准化动作请求
// ✅ 安全:AI 只说"要做什么",不说"怎么做"{"action":"file_move","params":{"from":"~/Desktop/screenshot_001.png","to":"D:/Backup/Screenshots/screenshot_001.png"}}
然后由**执行器(Executor)**根据当前系统自动适配:
-
Windows → 调用 .NET FileSystem.MoveFile() -
macOS/Linux → 调用 POSIX rename()
好处:
-
✅ 跨平台兼容 -
✅ 参数校验 + 类型检查 -
✅ 结构化日志,便于审计 -
✅ 执行前就能判断风险
五、安全问题:如何确保 AI 不乱来?
这是所有人最关心的问题——给 AI 这么高的权限,它要是”发疯”怎么办?
OpenClaw 的答案:不靠信任,靠架构硬隔离。
五大安全原则
1. 最小权限原则
-
默认只读,禁止写入 -
Shell 执行默认关闭 -
只有用户明确授权,才能开启新权限
2. 路径沙箱
-
只允许访问桌面、文档、下载等指定目录 -
禁止访问系统盘关键路径 -
自动解析 ../穿透,防止路径穿越攻击
3. 动作抽象
-
AI 不直接碰系统,只生成动作请求 -
真正执行的是经过安全校验的执行器 -
任何高危操作都会被拦截
4. 二次确认
-
删除文件、执行命令、批量操作等高危行为 -
AI 提议 → 系统拦截 → 发送确认卡片 → 用户确认 → 执行
5. 全链路审计
-
谁、何时、什么意图、执行什么动作、结果如何 -
全部本地记录,可查、可追溯、可问责
关键认知:安全不靠 AI 模型”对齐”,靠架构约束。就算 AI 被恶意诱导,它也做不了未经授权的事。
六、与传统 AI 的对比
|
|
|
|
OpenClaw |
|---|---|---|---|
| 核心定位 |
|
|
本地优先的AI执行网关 |
| 运行模式 |
|
|
常驻守护进程,支持主动执行 |
| 交互入口 |
|
|
50+ 通讯渠道原生适配 |
| 隐私设计 |
|
|
默认本地存储 |
| 上手门槛 |
|
|
开箱即用,零代码可用 |
| 执行能力 |
|
|
✅ 直接操作系统/软件 |
| 安全控制 |
|
|
✅ 架构级硬隔离 |
七、谁适合用 OpenClaw?
✅ 推荐使用的人群
1. 个人用户
-
想提高办公效率,让 AI 帮你处理重复性工作 -
关注隐私,不希望数据上传到云端 -
有一定技术基础,能自己配置环境
2. 开发者
-
想快速搭建自己的 AI 助手 -
需要跨平台、多渠道的消息处理能力 -
希望有完整的权限控制和审计机制
3. 小团队
-
需要自动化处理客服咨询 -
想实现每日报表自动生成和推送 -
预算有限,不想购买昂贵的企业级 RPA 软件
❌ 不推荐使用的情况
1. 完全零基础的小白用户
-
OpenClaw 需要一定的命令行操作能力 -
配置文件需要手动编辑 -
遇到问题需要自己查文档、提 Issue
2. 企业级大规模部署
-
OpenClaw 目前更适合个人或小团队 -
大型企业需要更完善的权限管理、审计合规 -
建议等待官方推出企业版
3. 对稳定性要求极高的场景
-
OpenClaw 还在快速迭代中,可能存在 Bug -
核心业务系统不建议完全交给 AI 自动化 -
可以作为辅助工具,但不建议完全依赖
八、快速开始:如何部署 OpenClaw?
系统要求
- 操作系统:
macOS / Linux / Windows(WSL) - Node.js:
v22+ - Docker:
最新稳定版(用于沙箱隔离) - 内存:
至少 8GB(推荐 16GB) - 存储:
至少 10GB 可用空间
安装步骤(以 macOS 为例)
Step 1:安装 Node.js
# 使用 Homebrew 安装brew install node@22
Step 2:安装 OpenClaw
npm install -g openclaw
Step 3:初始化配置
openclaw init
这会创建配置文件 ~/.openclaw/config.json:
{"gateway":{"port":18789,"host":"127.0.0.1"},"models":{"default":"claude-3-5-sonnet","fallback":"gpt-4o","local":"llama3:8b"},"skills":{"enabled":["file_manager","browser_control","email_client"]}}
Step 4:配置 AI 模型
-
如果使用云端模型(推荐新手):填入 OpenAI/Claude API Key -
如果使用本地模型:安装 Ollama,下载模型(如 ollama pull llama3)
Step 5:启动服务
openclaw start
Step 6:连接聊天软件以钉钉为例:
-
在钉钉创建机器人,获取 Webhook URL -
在 OpenClaw 配置中添加钉钉频道 -
在钉钉群里@机器人,开始对话
第一个测试指令
帮我列出桌面上所有的 PDF 文件
如果一切正常,AI 会扫描你的桌面,返回一个 PDF 文件列表。
九、局限性与挑战
当前的不足
1. 学习曲线较陡
-
需要一定的技术基础(命令行、配置文件、API Key) -
文档以英文为主,中文资料较少 -
社区还在成长中,遇到问题可能找不到现成答案
2. 平台支持不均衡
-
macOS 支持最好,Linux 次之,Windows 相对较弱 -
某些功能(如 iMessage 集成)仅限 macOS -
国内平台(微信、QQ)的集成需要自行配置
3. 安全性仍需加强
-
虽然有五层防护,但如果用户配置不当,仍有风险 -
插件生态尚未成熟,第三方插件的安全性无法保证 -
曾出现过安全漏洞(2026 年 2 月版本修复了 SHA-1 加密问题)
4. 性能开销
-
常驻后台会占用一定内存(约 500MB-1GB) -
浏览器自动化比较耗资源 -
低配电脑可能会感到卡顿
未来发展方向
根据官方路线图,OpenClaw 计划在以下方面持续改进:
- 更智能的任务分解:
从单智能体演进到多智能体协作 - 更强的安全控制:
细粒度权限管理、实时威胁检测 - 更广泛的应用集成:
企业系统无缝对接(SAP、Salesforce 等) - 更好的用户体验:
图形化配置界面、一键安装向导 - 更丰富的插件生态:
社区贡献的技能市场
十、总结:OpenClaw 代表了什么?
技术层面
OpenClaw 不是第一个 AI Agent框架,但它可能是第一个真正落地的个人 AI执行系统。
它把学术界最前沿的概念——ReAct(推理 + 行动)、Tool Use(工具使用)、Planning(任务规划)、Sandbox(沙箱隔离)、Memory(持久记忆)——全部做成了普通人可用的产品。
行业层面
OpenClaw 的出现,标志着 AI 行业正在经历一场从”思考”到”执行”的范式转移。
- 过去十年:
AI 学会了看(计算机视觉)、听(语音识别)、说(语音合成)、写(文本生成) - 未来十年:
AI 将学会做事(任务执行)
对个人的启示
如果你是一个关注效率的人,OpenClaw 值得你投入时间学习。它可能不会立刻改变你的工作方式,但它代表了一个方向:
AI 不再漂浮在云端,而是落地在你的设备里,成为你可信任、可控制、可依靠的执行伙伴。
互动话题
💬 你最希望 AI 助手帮你做什么工作?
A. 文件整理与归档B. 数据报表生成C. 消息自动回复D. 浏览器自动化操作E. 其他(评论区聊聊)
欢迎在评论区分享你的想法!如果你觉得这篇文章对你有帮助,也欢迎转发给更多朋友~
下期预告
这是”OpenClaw 深度解析”系列的第 1 篇,后续还有更多精彩内容:
- 第 2 篇:
《深度拆解:OpenClaw 如何让 AI 从”能说”到”能做”》——架构原理详解 - 第 3 篇:
《安全沙箱揭秘:给 AI 高权限之前,你必须知道的 5 个设计原则》——安全专题 - 第 4 篇:
《实战指南:如何用 OpenClaw 搭建你的私人 AI 助理》——手把手教程
关注我,不错过每一篇干货!
参考资料:
-
OpenClaw 官方 GitHub:https://github.com/openclaw/openclaw -
OpenClaw 官方文档:https://docs.openclaw.dev -
OpenClaw 架构白皮书
夜雨聆风