稍微讲讲OpenClaw到底在Claude Code的基础上还做了哪些
上回说到
上一篇我们搞清楚了一件事: OpenClaw 不是 Claude Code 的”套壳”,它有自己独立的 1,782 个文件的 Agent Runtime ,默认模型是 GPT-5.5 , Claude Code 只是它可选的编程外包技能之一。
那问题来了——如果不是套壳, OpenClaw 到底比 Claude Code 多了些什么?
我把两个系统的源码摊开来,逐个模块对比了一轮。结论很简单:Claude Code 做的事, OpenClaw 也做,但做得粗一些; OpenClaw 做的事, Claude Code 有一大半压根就没做。
先看全景:谁做了什么
这张表概括了两者的能力边界:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
一目了然: Claude Code 在”编程”和”上下文管理”上领先, OpenClaw 在其他所有维度上领先——因为 Claude Code 根本就没做那些。
编程能力: Claude Code 为什么更强
有意思的是,虽然 OpenClaw 的代码量是 Claude Code 的 70 倍( 14,700 个文件 vs 200 个),但在纯编程场景下, Claude Code 的表现反而更好。
原因藏在工具设计里。
Claude Code 给 AI 模型提供了一套专门为代码操作设计的工具:
Edit → 精确字符串替换(old_string → new_string)Grep → 正则搜索代码Glob → 文件模式匹配Read → 带行号读文件
每个工具的提示词里都有详细的编程场景指引,比如 Edit 工具会告诉模型”保持精确缩进”、”old_string 必须在文件中唯一”。
OpenClaw 呢?编程相关的工具主要就一个:
exec → 执行 shell 命令(通用的,不是专门为编码设计)
要编辑文件只能通过 exec 调 sed 或者写脚本——精确度远不如 Edit 工具那种 diff-based 的替换。
这不是 OpenClaw 做不了,而是设计取舍。 OpenClaw 的工具要兼容 20 多个 LLM Provider ,精调的编程工具依赖模型对特定格式的理解,跨 Provider 很难保证效果。所以 OpenClaw 用了更通用但也更粗糙的方式。
20+ LLM Provider :不只是”多了几个选择”
Claude Code 只支持 Anthropic 的 Claude 系列模型。 OpenClaw 支持 20 多个 LLM Provider ,每个都是独立的插件包:
extensions/openai/ → GPT-5.5(默认)extensions/anthropic/ → Claude 系列extensions/google/ → Geminiextensions/deepseek/ → DeepSeekextensions/ollama/ → 本地模型extensions/alibaba/ → 通义千问extensions/tencent/ → 腾讯混元...还有十几个
每个 Provider 自己维护模型目录、定价信息、 context window 大小。比如 OpenAI 的 Provider 里这样定义:
const OPENAI_GPT_55_CONTEXT_TOKENS = 272_000;const OPENAI_GPT_55_COST = { input: 5, output: 30, cacheRead: 0.5};
这意味着用户可以根据场景选择模型——需要便宜的日常对话用 DeepSeek ,需要强推理用 Claude ,需要跑在本地用 Ollama 。 Claude Code 没有这个灵活度。
20+ 消息通道:让”所有人”都能用 AI
Claude Code 的入口是终端。你得打开 Terminal ,输入命令,看文字输出。
OpenClaw 的入口是你日常用的消息平台。 WhatsApp 、 Telegram 、 Discord 、 Slack 、 Signal 、微信——总共 20 多个通道适配器,都在 extensions/ 目录下:
extensions/telegram/extensions/discord/extensions/slack/extensions/whatsapp/extensions/signal/extensions/wechat/...
技术上这些通道适配器不算特别复杂——本质就是消息格式转换 + HTTP 回调处理。但产品价值巨大:它把 AI 助手的门槛从”会用终端的开发者”降到了”会发消息的任何人”。
你奶奶也能用。在微信里发条语音, OpenClaw 就能帮她查天气、定闹钟、回消息。
语音:不是”录音转文字”那么简单
说到语音, OpenClaw 的语音输入能力值得单独聊聊。
这不是那种”录完一段话 → 上传 → 等几秒 → 返回文字”的离线处理。它是实时流式转录——你说话的同时,文字就在出来。
以 Deepgram 为例, OpenClaw 通过 WebSocket 建立实时连接:
// 实时 WebSocket 连接url.protocol = "wss:";url.pathname = "/listen";url.searchParams.set("model", "nova-3");url.searchParams.set("encoding", "pcm16");
音频以 Buffer 实时发送,服务端返回 partial (中间结果)和 final (最终结果),还支持 barge-in——你说到一半可以打断 AI 的回答。
STT 和 TTS 都是插件化的:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
Claude Code 完全没有这个能力维度。
多媒体生成:图片、视频、音乐
OpenClaw 能让 AI 直接生成多媒体内容。这些都是独立的 Agent 工具:
|
|
|
|---|---|
image-generate-tool |
|
video-generate-tool |
|
music-generate-tool |
|
tts-tool |
|
你可以在 Telegram 里告诉 OpenClaw “帮我画一张猫在月球上弹吉他的图”,它会调用图像生成服务,直接把图片发回给你。
Claude Code 没有这些——不是技术上做不到,而是它的定位就是编程助手,多媒体不在它的范围内。
插件生态: ClawHub 市场
Claude Code 没有公开的扩展体系。你用它提供的工具就好。
OpenClaw 有一个完整的插件 SDK ,package.json 里暴露了 400 多个 SDK 子路径导出:
{ "exports": { "./plugin-sdk": "...", "./plugin-sdk/core": "...", "./plugin-sdk/agent-runtime": "...", "./plugin-sdk/channel-runtime": "...", // ... 400+ 个子路径 }}
第三方开发者可以独立开发 Provider 插件、 Channel 适配器、 Memory 模块、自定义 Tool 。ClawHub[1] 是官方的插件市场,类似 VS Code 的 Extension Marketplace 。
那技术含量到底怎么分层?
聊到这里可能有人会问:通道适配、多媒体调用,这些技术上不难吧?
确实。我把 OpenClaw 的创新按技术深度分了三层:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
通道和多媒体本质上是”把已有的 API 适配好、集成好”,技术壁垒不高,但产品壁垒很高——第一个把 20 多个平台全部适配好开箱即用的人,后来者很难追。
真正在技术深度上值得研究的,是记忆系统和多 Agent 编排——这两个方向 OpenClaw 和 Claude Code 都在做,但走了完全不同的路。
下一篇预告
那 OpenClaw 和 Claude Code 在各自擅长的领域,到底谁更强?上下文压缩谁做得更精细? Token 效率谁更优?为什么 Claude Code 有一个 OpenClaw 无法复制的结构性优势?
下一篇,我们带着数据来聊。
参考链接
[1] ClawHub: https://clawhub.ai/
夜雨聆风