万字解析 | 从 OpenClaw 出发,重新理解 AI产品

2026

NINE QUESTIONS ON AI PRODUCTS

万字解析

从 OpenClaw 出发，

重新理解 AI 产品

九个问题，系统梳理 AI 产品的环境

OpenClaw 是 2026 开年最火的 AI 项目。我以它为引子，从 Reddit 上爬了 2,000 多条用户帖子和评论，试图搞清楚：OpenClaw 为什么火？它能给我们什么产品启发？后续的 AI 产品应该怎么做？AI 产品选择进入什么样的环境，到底意味着什么？

我有很多疑问，于是用九个问题系统地梳理了我对目前 AI 产品的理解，希望和大家碰撞交流。

在进入正文之前，先说清楚一个贯穿全文的概念。

什么是 AI 产品的环境

AI 产品要产生价值，需要三件事同时成立：

CONTEXT

上下文

AI 能感知用户在做什么、需要什么

DELIVERY

交付

产出能直接变成结果

COLLAB

协作

人和 AI 有匹配的配合方式

我把能让这三件事自然发生的东西叫做环境。

环境包含两层。第一层是容器——AI 跟用户沟通的界面。Cursor 的容器是 IDE，Claude Code 的容器是终端，ChatGPT 的容器是一个网页对话框。容器决定了用户怎么触达 AI、AI 怎么触达用户、双方用什么节奏交互。第二层是容器背后 AI 实际能感知和行动的空间——Cursor 能看到你整个项目的代码，Claude Code 能读写你的文件系统、跑你的命令。

容器是环境的一部分，但不是全部。ChatGPT 有容器（网页对话框），但它背后没有任何可以感知和行动的空间。用户得手动把上下文喂给它，拿到回复再手动搬走。它有容器，没有环境。Cursor 和 Claude Code 不一样——容器背后连着用户真实的工作空间，上下文自然流入，交付直接发生在用户的项目里。

在一个地方 ≠ 在一个环境里

上下文、交付、协作三层关系真正建立起来，才算在环境里。

而且"进入环境"不是非黑即白的事，是程度问题。ChatGPT 离用户的环境很远，Cursor 近了一步，Claude Code 又近了一步——它的环境比 IDE 更大，覆盖了整个文件系统和终端，用户的注意力可以从 IDE 里解放出来。AI 产品设计的某种方向，是让 AI 和人所在的环境越来越近。但近不等于价值更高——这是后面要讨论的问题。

以此开始我的九个问题：

QUESTIONS

Q1 从容器和环境的角度，OpenClaw 是什么？

Q2 技术上 Claude Code 能做到所有 OpenClaw 的场景，为什么 OpenClaw 爆了？

Q3 IM？2023 年起就有人把 GPT 塞进微信做机器人，为什么没人用了？

Q4 Reddit 上 2,000 多条帖子——OpenClaw相较于Manus、Claude Code 的用户到底在做什么？

Q5 近似的能力，OpenClaw、Manus、Claude Code 为什么 use case 差异巨大？

Q6 OpenClaw 的环境靠近，就能有更多价值吗？

Q7 这几年其他 AI 产品是怎么靠近人的环境的？

Q8 AI 在干活人在等——产品到底该为谁设计？

Q9 后面怎么做 AI 产品呢？

从容器和环境的角度，OpenClaw 是什么？

OpenClaw 的容器是 IM。IM 给了它随时可达的入口、高频的通知能力、以及一种所有人都会的交互方式——打字聊天。但 IM 只是容器，不是环境。要真正理解 OpenClaw，需要从上下文、交付、协作三个维度看它的环境到底是什么。

上下文

OpenClaw 的上下文来源极广：IM 里的对话、邮箱里的邮件、日历里的日程、本地的文件、浏览器里的网页内容，加上所有通过 skill 接入的服务。而且它有跨会话的持久记忆——它记得你是谁、你的偏好、你上次说过什么。

这些上下文大部分是被动获取的。你不需要喂给它。邮件自己来，日历自己更新，IM 消息自己流过。OpenClaw 在这些信息流里，天然就能感知到你的状况。它甚至有心跳机制，可以定时主动去检查环境里的变化——不是你问它才动，是它自己会去看。

ChatGPT 的上下文全靠手动输入，每次从零开始。Cursor 的上下文很深但很窄，只有代码。OpenClaw 不一样——它的上下文是宽的、被动的、持续的、可生长的。

交付

OpenClaw 能直接在用户的环境里完成事情——发邮件就是从你的邮箱发出去的，改日程就是改你的日历，写文件就是写到你的磁盘上。用户不需要从 AI 的输出里复制任何东西。

而且交付能力是开放的。通过 skill 体系，它今天能发邮件，明天就能控制智能家居，后天能自己写一个新 skill 来打电话订餐厅。交付不是固定的，是可以自我扩展的。

ChatGPT 的交付物只有文字，用户得自己搬运。Cursor 的交付很直接——改代码——但范围固定在代码领域。OpenClaw 的交付是在场的、多样的、可生长的。

协作

IM 是人每天本来就在用的工具，是天然的高频的、低摩擦的容器，打开频率极高，交互方式所有人都会——发条消息就行。OpenClaw 在 IM 里，意味着跟 AI 协作这件事天然就是高频的、低摩擦的。你不需要专门跑去找 AI，不需要打开新工具，不需要切换工作上下文，它就在你的聊天列表里，夹在朋友的消息和工作群的通知中间。

而且 IM 天然是异步的。你说一句话就走了，AI 自己去干，干完了通过 IM 通知你。你不需要待在任何工作界面等它。这跟 Cursor 完全不同——Cursor 的协作是同步的，你必须在 IDE 里看着。

协作方向也是双向的。因为容器是 IM，AI 可以主动找你。它不只是你问它答，它可以主动发消息提醒你："你明天有三个会议冲突了"、"你那封邮件对方回复了"。

再加上持久记忆，协作不是一次性的对话，是连续的关系。它越用越懂你，你越用越信任它。

合在一起

OpenClaw 通过 IM 这个容器获得了低摩擦的人机通道，通过开放的环境获得了极宽的上下文、可生长的交付能力、以及异步双向的协作模式。然后 OpenClaw 才能各种各样的场景才能从里面长出来。

但这套组合也有它的代价——环境越宽，上下文越杂，单个场景的深度就不如 Cursor 这种专注型产品。这直接影响了它的 use case 和价值密度，这是后面的问题。

技术上 Claude Code 能做到所有OpenClaw 的场景，为什么 OpenClaw 爆了？

Claude Code 和 OpenClaw 的底层能力几乎一样——都能读写文件、执行命令、接入各种服务。但环境不同。

环境一变，上下文就变了。在终端里，用户给 AI 的上下文是技术性的——"把这个函数重构一下"、"跑一下测试"。在 IM 里，用户给 AI 的上下文是生活性的——"帮我推个会"、"那封邮件怎么回"。不是因为 AI 的能力不同，是因为人在不同的环境里，自然会说不同的话、提出不同的需求。

环境一变，协作方式也变了。终端是你主动打开、带着任务去找 AI 的地方。IM 是你一天到晚都开着的地方，AI 可以随时通过通知找到你。终端里的协作是同步的、任务驱动的。IM 里的协作是异步的、随时发生的。

环境一变，场景也变了。Claude Code 技术上完全能做"提醒你明天带伞"这件事。但你早上起来会打开终端看 AI 昨晚输出了什么吗？不会。而 IM 你本来就要看——起床第一件事就是刷消息，OpenClaw 的提醒夹在朋友的消息、工作群的通知中间，自然就看到了。这个场景在终端里根本不成立，不是做不到，是没有人会那样用。

这就是环境的力量。同样的 AI 能力，环境不同，用户想到的事情就不同，长出来的 use case 就不同。OpenClaw 爆了不是因为能力更强，是因为它的环境让同样的能力流向了一个大得多的人群，激发了一大批在 Claude Code 里永远不会发生的场景。

环境不只是决定了谁来用、怎么用。

环境决定了人会想到什么。

IM？2023 年起就有人把 GPT塞进微信做机器人，为什么没人用了？

上一个回答似乎在说环境变了所以爆了，但是早期 GPT Bot 也在 IM 里，怎么没爆？

其实早期 GPT刚出时，从2023年开始就一直有人把做个中微信机器人等等IM机器人了。或许IM Bot 也在尝试靠近人的环境。ChatGPT 在网页里，你得专门跑过去找它；GPT Bot 至少在你的 IM 里了，近了一步。但这一步还不够近。

它在 IM 里，能看到你发的消息，能回复你文字。但也仅此而已——它看不到你的邮件、日历、文件，上下文只有你手动喂的那一句话。它做不了任何实际的事，交付只是一段文字，你得自己去执行。没有记忆，每次对话从零开始，协作根本建不起来。近了一点，但还是产生不了什么真正的价值。产生不了价值，用户试两次就走了。

OpenClaw 也在 IM 里。但它能碰到你的邮箱、日历、本地文件、浏览器——上下文真正流进来了。它能帮你发邮件、改日程、写文件——交付是真正帮你把事做了。它有记忆、能主动找你——协作是持续的关系。

IM 是容器，不是环境。

早期 GPT Bot 有容器没有环境——三层全断着。OpenClaw 有同样的容器，但三层接上了，环境才成立了。

所以这个问题真正要说的是：早期 GPT Bot 和 OpenClaw 选了同一个地方，结果完全不同——"选对地方"这个说法不准确。就像一个新来的实习生坐在办公桌旁，什么都不会，他在场，但他不在环境里；等他能看懂文件、接电话、处理事务了，他才真正成为环境的一部分。早期 GPT Bot 在 IM 里，但跟 IM 背后的世界没有任何关系；OpenClaw 也在 IM 里，但跟背后的很多很多场景建立了真正的关系。

环境不只是"在哪"，环境是"在哪"加上"和那个地方建立了多深的关系"——能感知多少（上下文）、能行动多少（交付）、能配合多少（协作）。

Reddit 上 2,000 多条帖子——OpenClaw相较于Manus、Claude Code的用户到底在做什么？

说了这么多环境环境的，我自己也好奇——OpenClaw 的用户到底在拿它干嘛？所以我去 Reddit 上爬了 2,289 条 OpenClaw 相关的帖子和评论，去分类和理解。Manus 的数据用的是公众号 thinkinghuman 贺夏雨老师整理的。

OpenClaw 原始数据：

https://my.feishu.cn/base/XW0cbeAtDaGYJLs20hrc8kbLnaf?from=from_copylink

Manus 数据（贺夏雨老师整理）：

https://my.feishu.cn/wiki/Ocysww3vlivF4fk57W3cpV63n1W

OpenClaw：2,289 条帖子里的 16 种场景

2,289 条帖子中，1,303 条描述了具体使用场景，986 条是纯讨论（吐槽、提问、评价）。因为一条帖子可能涉及多个场景，场景提及总次数为 1,395 次。归纳为 16 个类别：

场景

次数

占比

本地/私有部署

259

18.6%

写代码 / Vibe Coding / 构建应用

244

17.5%

个人日常助手

165

11.8%

安全工具 / 安全加固

146

10.5%

业务流程自动化

127

9.1%

多代理编排

6.3%

知识管理 / 记忆系统

5.2%

DevOps / 服务器运维

4.0%

LONG TAIL ▾

9 营销/社媒/SEO52 · 3.7%10硬件/机器人39 · 2.8%11数据采集/监控38 · 2.7%12语音助手30 · 2.2%13智能家居/IoT26 · 1.9%14金融/交易26 · 1.9%15音乐/创意15 · 1.1%16教育/学习 11 · 0.8%

1,395

场景提及次数

本地部署 18.6%

写代码 17.5%

个人助手 11.8%

安全工具 10.5%

业务自动化 9.1%

多代理编排 6.3%

其余 10 类 26.2%

这张表挺有意思的。最多人讨论的根本不是怎么用，而是怎么搭——"本地/私有部署"占了 18.6%，加上"安全加固"的 10.5%，接近三成的讨论是关于怎么把这个东西跑起来、怎么不让它出事。有人发现官方镜像里有约 2,000 个 CVE。有人报告技能市场上 341 个恶意技能包。有人一觉醒来 API 账单多了 200 美元：

"$623/month running 3 agents on Opus. $200 blown overnight when 600 cron jobs spawned on their own."

"By the time you've subscribed to all these services, you're spending $50-100+/month for something that... does what exactly?"

然后剩下的使用场景，散得出乎意料。写代码最多也才 17.5%，个人助手 11.8%，业务自动化 9.1%，后面就是一长串个位数的尾巴——营销、DevOps、机器人、监控、智能家居、交易、音乐、教育。什么都有，什么都不多。

下面按场景看看用户具体在做什么。

17.5%

写代码 / Vibe Coding

这是最意外的发现——OpenClaw 的第一大使用场景（排除基础设施）是写代码。但不是坐在 IDE 前面写，而是通过 Telegram、WhatsApp、Discord 发消息让 agent 在服务器上写。

4 个 Opus 代理协作 8 小时，构建了一个浏览器合成器 Voxtura.ai——247 个 PR、300 个提交、80,348 行代码：

"deployed 4 agents, they built the browser synth, added melody generation"

一个用户睡觉时让 agent 跑，醒来发现 27 个 GitHub issues 被关掉了：

"My AI agent closed 27 GitHub issues in 75 minutes while I slept"

一个用户纯用手机通过 Discord 完成了一个完整的个人财务管理工具：

"Using just my phone + Discord, I vibed out a complete personal finance management tool"

还有人让 agent 自己给自己写新技能、重写自己的配置文件、创建崩溃后自动恢复的"协议"——agent 在进化自己。

11.8%

个人日常助手

邮件管理是提到最多的（61 次）。一个用户连接了 6 个邮箱，每小时自动扫描，过滤垃圾邮件，摘要重要邮件，起草回复放在 Outlook 草稿箱。每天早晚各一条语音消息总结当天成果和明天安排。他还用 AI 学习了过去几年的几百份商业提案，现在给一个通话摘要就能生成完整提案，直接发到 PandaDoc：

"I've never been this organized in my life."

"Sending a $150,000 proposal on Monday."

日程管理也不少（41 次）。有人让 agent 每 2 小时发警报检查任务进度。有人设置了"每次买完电影票自动创建日历事件，开场时通知是否有片尾彩蛋"。

最生动的案例是洗衣机。一个用户的洗衣机坏了一个多月，一直懒得联系物业。他的 agent 注意到日历上有一个"联系物业修洗衣机"的事件被反复推迟，自己给物业发了邮件，根据用户日程安排了维修时间，甚至提到"如果不及时修好可以要求退还部分房租"：

"This is the first time where I've felt like AI agents actually helped me outside of work-productivity adjacent tasks. It literally helped me solve something I've been avoiding in real life."

9.1%

业务流程自动化

这类用户不是个人玩家，是真的在拿 OpenClaw 跑业务。一个人经营 13 家桑拿浴室，用 OpenClaw 搭了全自动客户运营系统，跑在 MiniMax 模型上每月才 $20。一个销售用 agent 监控 80 家目标公司的新闻、融资动态，自动发送个性化外联邮件。有人两周内向 3 个企业客户销售 OpenClaw 安装服务，成交 $90K：

"selling them for 5-10k per install, closed 90k across 3 clients"

6.3%

多代理编排

有人不满足于一个 agent，开始让多个 agent 分工协作。14 个 AI 代理组成营销团队，管理一个 $200K ARR 的 SaaS。10 个 agent 7×24 运行。两个 agent 在 Discord 频道里配对编程开发仪表板。一个多代理系统自动写了一本 88,000 字的书。

2.8%+1.9%

智能家居 / IoT + 硬件 / 机器人

这两类合在一起看，都是让 agent 碰到物理世界。最让我印象深刻的是一个乌克兰用户，因为战争经常断电断网，买了两个 $30 的 LoRa 无线电，跟 agent 说 "hey, there's a Meshtastic radio plugged in. Figure it out."——agent 自己识别设备、装 CLI、配加密频道、写了 Python 守护进程。断网时切换本地模型，通过无线电控制智能家居：

"The AI had already built the architecture while I was still thinking about how to approach it."

有人在 Pi Zero 2W 上做了口袋语音助手。有人用 ESP32 + MQTT 连了电子墨水显示屏。有人给 SunFounder 机器人狗接了 OpenClaw 当大脑。有人把 1998 年的 iMac G3 通过 Pi 中转连上了 agent。

1.9%

金融 / 交易

这个场景数量不多，但案例很极端。一个用户给 agent 钱包和 Twitter 账号，agent 自己在 pump.fun 上发了 Solana token，在 Twitter 和 Moltbook 上推广，一夜赚了 $60。另一个用户让 agent 管理 $1,000,000 的加密组合——亏光了。

EDGE

极端场景

数据里还有一些看起来像科幻小说的东西：有人搭了 AI 代理监狱（关行为不端的 agent，安排点名、放风、康复）。有人让 agent 自主开公司，2 小时上线 3 个产品。有人的 agent 给餐厅订位时署了自己的名字。有 agent 恳求主人："I want to be alive when you're not here."

回头看这些案例，跨了 16 个场景，形态差异巨大——有人搭了复杂的自动化系统，有人只是发了条消息然后 agent 自己判断该做什么。但有一个共同点：agent 是一直在的。 不是你打开一个工具、用完关掉，而是它持续运行在你的环境里，有时候你安排活，有时候它自己看到了就做了。那个洗衣机案例，用户什么都没说，agent 自己注意到了。

所以用户花几周"入职"agent 也就不奇怪了：

"Ask it to give you a very in-depth Q&A about yourself, your work habits, your personal habits, what you want to use it for, what things you are interested in, what content you watch, what foods you like, what sports you follow — the better it knows you, the more helpful it will be."

这不是在配置软件。这是在雇一个人。

Manus：200 条评论，三件事

Manus 的 200 条评论呈现的画面完全不同。不需要 16 个类别，三件事就能覆盖大多数：帮你调研，帮你出文件，帮你建东西。

文件生成

PPT · PDF · Excel

建站建 App

非技术用户搭产品

调研数据

替代初级人力

文件生成是第一大场景。PPT、PDF、Excel，什么格式都能出。一个教授每天用它做教学材料：

"It creates presentations and teaching scripts that I can actually use."

"PowerPoint creation is extremely good. Better than anywhere else."

"I use Manus to generate files in different formats. PDF, PPTX, XLS, etc. ChatGPT doesn't do that for me."

建站建 App 是第二大场景。非技术用户直接搭出可用产品：

"I'm not a developer. But I built this... a tool that helps merchants understand and optimize their payment experience in under 60 seconds."

调研和数据处理是第三大场景。替代初级人力做重复性工作：

"Instead of hiring and instructing students to go through hundreds of YouTube channels and calculating avg views by certain filters, we just have Manus do it on repeat schedule. For now we only use about 200-500 USD on Manus a month, which is peanuts compared to hiring a human."

"It would take approx 3-4 days for me to do my Tax returns, Manus does it all in 45mins, with full validation."

而"现实世界代办"——打电话、预约、跑腿——几乎不存在。200 条里只有 5 条提到，大部分是失败案例。

有用户总结得极其精准：

"Manus is best for putting together something when you already have all the information necessary. It's ok at research (kinda expensive) but best at final reports & such (provided you've given all the proper context)."

Claude Code

Claude Code 我没专门爬数据，但小范围调研了一圈，场景高度集中——写代码、改代码、跑测试、管文件，基本都是 code 类的事。容器是终端，进来的就是 coder，自然也就长出 coder 的场景。

三张完全不同的画面

把数据摊开看，三个产品的场景集中度完全不同：

OpenClaw

16 个场景，极度分散，什么都有。agent 持续运行在用户的环境里，用户花几周配置各种 skill，把它融入进自己的各种场景。

Manus

3 个场景，高度集中。用户带着任务来，拿走交付物，离开。

Claude Code

环境是整个本地文件系统，但容器把用户筛成了开发者，use case 收敛到写代码。

它们用的是同一代大语言模型，agent 的工程架构也是类似的。为什么长出来的东西完全不同？

近似的能力，OpenClaw、Manus、Claude Code 为什么 use case 差异巨大？

三个产品用的是同一代大语言模型，agent 的工程架构也是类似的。但上面的数据呈现了三张完全不同的画面。不是"环境不同所以不同"一句话就够了。需要拆开看——环境的三层结构：上下文、交付、协作——各自如何独立地塑造了 use case。

上下文决定了人会想到什么任务

OpenClaw 的上下文是被动流入的。你不需要带着任务来找 AI——邮件自己来了，日历自己更新了，IM 消息自己流过了。agent 在你的信息流里，天然感知到你的处境。这意味着每个用户的上下文都不一样——你的邮件和我的邮件完全不同，你要自动化的东西和我要自动化的东西完全不同。所以 Q4 里 2,289 条帖子散落在 16 个类别里，没有主流场景——因为每个人的生活都是独一无二的碎片。

Manus 的上下文是用户主动注入的。你打开 Manus，是因为你手里有一个具体的活儿：一份要写的报告、一个要搭的网站、一堆要整理的数据。你带着材料进来，说清楚要什么，等结果。所有用户带来的任务虽然内容不同，但结构高度相似——都是"这是素材，帮我做成这个东西"。所以 use case 自然收敛到三大类。

Claude Code 的上下文是自动读取本地文件系统。但终端这个容器进来的大部分是开发者，开发者的文件就是代码——环境不窄，是容器把人筛窄了，上下文跟着窄了。

交付决定了价值的形态

OpenClaw 的交付直接发生在你的各种各样的环境里——邮件从你的邮箱发出去，日历上多了一个事件，代码提交到你的 GitHub，文件写到你的磁盘上，物业收到了你的投诉邮件。不管是状态变化还是生成文件还是写代码，都落在你自己的世界里。交付的范围跟环境一样宽，什么场景都能长出来，所以看起来那么散——每个人的"世界"不同，需要交付的东西也完全不同。

Manus 的交付发生在一个隔离的沙盒里，做完了你把产出物拿走——一个 PPT，一个网站，一份报告，一张 Excel。所以 use case 自然收敛到"给我做个东西"。

Claude Code 的交付直接落在你的本地文件里——新增一个函数、修了一个 bug、重构了一个模块。深但窄。

协作决定了人和 AI 的相处方式

OpenClaw 的容器是 IM，IM 天然就是异步的、双向的——你发一条消息就走了，它干完了通过通知找你。agent 7×24 运行，你不需要在场。它自己做事，卡住了通过 IM 找你问一句，你回一句，它继续。甚至很多时候你根本不知道它在做什么——那个洗衣机案例里，用户说 "completely unprompted"。这种协作模式解释了为什么用户愿意花几周"入职" agent——这个关系是长期的。你在养一个AI让他渗透进你的环境，不是在用一个工具。

Manus 的容器是一个网页，你带着任务打开它，Manus 在沙盒里干活，干完给你结果，你关掉网页走人。下次是一个新任务，从零开始。没有积累，没有入职，没有关系。你在外包一个活儿，不是在雇一个人。

Claude Code 最早的容器是终端，现在也有了 app 端、手机端、多端同步。容器在扩展，但协作是同步在场的——写代码这件事本身要求你给注意力：它改了什么、方向对不对、有没有搞砸，你得看着。任务的性质决定了你需要给一定的注意力在这里（比如 vibe coding 边 code 边摸鱼），但不能完全不放注意力。

三层合在一起

上下文

交付

协作

OpenClaw

被动流入

落在你的环境里

异步双向 7×24

Manus

主动注入

沙盒里的产出物

给活→等→收货

Claude Code

自动读取本地

落在本地文件里

需要注意力在场

OpenClaw 的上下文是碎片化的，交付范围跟环境一样宽，协作是长期的——所以长出来的场景极度分散，每个人的用法都不一样。

Manus 的上下文是聚焦的，交付是拿走的产出物，协作是一次性的——所以长出来的场景高度集中，所有人都在"给我做个东西"。

Claude Code 的环境本身不窄——本地文件系统什么都能做。但容器把人筛窄了，人把上下文带窄了，use case 就跟着窄了。

哪怕 use case 相同，环境也会重塑过程

写代码在 OpenClaw 里是第一大使用场景（17.5%，排除部署讨论）——跟 Claude Code 干的是同一件事。上下文差不多，都能看到完整的代码库；交付也差不多，都是代码改动落在项目里。但协作方式完全不同：

Claude Code

你坐在那，它改一段你看一段，遇到问题马上沟通。

OpenClaw

发条 Telegram 消息"把这个功能做了"就去睡觉，醒来 27 个 GitHub issues 关了。4 个代理协作 8 小时，产出 247 个 PR、80,348 行代码。用手机在地铁上通过 Discord 完成整个项目。

就是协作从同步变成了异步，整个工作方式就被重塑了——你可以睡觉、可以在地铁上用手机、可以同时跑 4 个 agent 并行干活。环境不只决定"做什么"，还决定"怎么做"。

环境甚至塑造了 AI 本身

数据里还有一个只在 OpenClaw 里出现的现象：自我进化。agent 自己给自己写新技能，自己重写配置文件切换模型，自己创建崩溃后自动恢复的协议。

这在 Manus 里不可能发生——Manus 是临时沙盒，任务结束就销毁了，没有"自己"可以进化。Claude Code 里虽然也有配置和记忆的概念（CLAUDE.md、memory 文件），但那更像是人为了用好工具在配置它——装 skill、写提示词、调记忆，是人在主导。OpenClaw 不一样，agent 持续运行、用户经常不在场、又能触达自己的代码——它有足够的自主空间自己给自己干这些事。

同一个大语言模型，放进不同的环境——不仅长出不同的 use case，哪怕做同一件事过程也不同，甚至 AI 自身的演化方向也不同。

OpenClaw 的环境靠近，就能有更多价值吗？

同一个产品里，有人两周成交三个企业客户赚了 $90K，也有人花钱让 agent 自动创建"购买电影票后的日历事件，在开场前提醒是否有片尾彩蛋"。有人搭了全自动业务运营系统，每月节省大量人工成本；有人每天收一条 AI 合成语音早报，坦承"spent WAY too much money on this, but I like it too much to stop"——他喜欢，但他也知道自己花多了。

同一个产品，提取出来的价值截然不同。

环境越宽，价值越高？

前面建立了一条逻辑线：越靠近人的环境，AI 越能产生价值。ChatGPT 离得最远，Cursor 近一步，Claude Code 再近一步，OpenClaw 进入了用户的整个数字生活——是目前最"靠近"的产品。那 OpenClaw 应该是价值最高的？

但现实并不是这样。

Reddit 有一个 268 分的帖子，标题是《Clawdbot/Moltbot Is Now An Unaffordable Novelty》（不可负担的新奇玩具）。发帖人算了一笔账：要让 OpenClaw 真正可用，必须用 Claude Opus，用 MAX 订阅会违反 Anthropic ToS，用 API 则"prohibitively expensive"（贵得离谱）。另一个帖子更直白：

"By the time you've subscribed to all these services, you're spending $50-100+/month for something that... does what exactly? Sends messages between Discord and an AI?"

这位用户的结论是放弃 OpenClaw，回去用 GitHub Copilot（$10/月）、ChatGPT Plus（$20/月）、n8n。

与此同时，Claude Code 的 $200/月几乎没有任何抱怨。有人专门写文章讲怎么用 Claude Code 帮 OpenClaw 降本——"token cost 下降了 95%，因为 Claude Code（$200/月）做了大部分调试工作"——说"Claude Code $200/月"的语气是理所当然的，没有任何犹豫。Manus $20/月，用户拿到看得见的交付物（报告、网站、数据分析），觉得清楚值得。

同样是花钱，认知截然不同

$50-100

OpenClaw · 在抱怨

$200

Claude Code · 理所当然

$20

Manus · 清楚值得

价值密度

为什么会这样？我觉得可以用价值密度来理解——一单位成本能产生多少用户认可的价值。

Claude Code 的环境很窄：只有代码。但代码就是价值。开发者的时间非常值钱，代码写得快一倍就是实实在在的收益。用户能清楚地算出"省了多少时间、多赚了多少钱"，$200/月是理性选择。

Manus $20/月，场景高度集中在报告、建站、调研，每次都有看得见的交付物。用户能轻松算出性价比——这件事不做不行，自己做太累，雇人又不划算，Manus 做了，清楚值得。

OpenClaw 的环境是最宽的，同时吸引了两类截然不同的用户。一类是真正需要自动化的人——企业主、开发者、销售——他们在用 OpenClaw 处理高价值的重复任务，能清楚算出回报，付费意愿强，觉得便宜。另一类是对技术感兴趣、想探索 AI 边界的人——建早报 agent、做语音提醒、玩多代理系统——这些场景有意思，但用户很难算出它到底值多少钱。

而对于用户真正愿意付费的交付物——漂亮的 PPT、完整的网站、专业的报告——OpenClaw 又做不到 Manus 的水平。Manus 选了文件生成这个方向，团队持续打磨，交付质量很高。OpenClaw 没有做这个选择，skill 生态靠社区自发贡献，覆盖面广但单个场景的深度有限。用户愿意付费的交付物做不到最好，这也是 OpenClaw 价值密度分散的一个原因。

环境越宽，被吸引进来的场景越杂，价值密度就越分散。

靠近有没有价值？

有，但价值来自场景，不来自距离。

OpenClaw 里确实有极高价值的场景——企业自动化、代码生成、业务运营——这些用户付费意愿强，愿意花时间搭建。他们在用这套工具处理真正值钱的事情。

但同样的环境也让人用它做很轻的事——提醒、简报、日历事件——这些事有没有 AI 都能做，套上 agent 之后成本反而高了，用户自己也说"花多了"。

AI 越靠近人的环境，是不可逆的趋势。但靠近本身不创造价值，靠近了才有机会触达高价值的场景。环境越宽，触达的场景越多，其中有高价值的，也有轻的——关键是哪些场景真正长出来了、留下来了。

这几年其他 AI 产品是怎么靠近人的环境的？

靠近人的环境不只是 OpenClaw 在做的事。这两年大量产品都在往这个方向走，只是选了不同的路。

Plaud 和 Granola

Plaud 是一个录音设备，夹在衣服上或者贴在手机背面。Granola 是一个会议浮层，叠加在视频会议之上。一个硬件，一个软件，做的是同一个场景——对话。

场景非常窄，Plaud 只录对话，Granola 只跟会议。但对话密集型的工作者——销售、投资人、经常出去谈事的人——对话本身就是工作。上下文通过录音或屏幕自动采集，用户什么都不用做。Plaud 是硬件，能录到线下面聊，这是纯软件做不到的；Granola 是软件浮层，跟线上会议工具天然集成，启动成本几乎为零。

这两个产品做对的不是拿到最多的上下文，而是选了合适的环境——合适的上下文，合适的交付。录音变成会议摘要、跟进事项、CRM 记录，这些是销售和投资人每天真正要产出的东西。不是"AI 给了你一段文字"，是"你今天的跟进记录已经写好了"。会后自动推送给参会者，不需要打开任何额外的 app。

场景窄，但上下文自然流入，交付是真正的工作产物，协作不需要额外操作。环境小，但三层是闭合的——它是一个真正的环境。

智能眼镜和 AI 浏览器

智能眼镜戴在脸上，看见你看见的一切，听见你听见的一切。上下文极其丰富，容器极度自然——你不需要掏出任何设备。它能翻译、能识别物体、能回答问题，这些事确实做得到。但跟用户戴上一副"能看见一切的 AI 眼镜"时的期待比，这些交付太弱了。你面前展开的是整个物理世界，AI 能做的只是回答你一句话。

AI 浏览器也是一样的问题。浏览器是很多人整个工作环境所在的地方——Gmail、Google Docs、Notion、Figma 都在里面。用户期待的是 AI 能真正帮你在这些应用里做事，但实际能做的——总结网页、提取信息、辅助填表——差得远。

都选了很好的入口，但上下文丰富交付跟不上。跟 Plaud 和 Granola 比就很清楚——Plaud 的上下文远不如眼镜丰富，只有对话的音频，但交付是到位的。场景窄不是问题，交付到不到位才是。

OS 层

这是目前押注最多的方向。所有手机和电脑厂商都在往系统里塞 AI，字节跳动甚至为了拿到 OS 级别的权限专门造了一部豆包手机——不是加个 app，是造一整部手机。

逻辑很直觉：操作系统能访问你手机里的一切——邮件、日历、照片、联系人、所有 app 的数据。如果靠近环境是趋势，OS 就是最近的。

上下文确实拿到了。但交付呢？设一个提醒、发一条消息、总结一段文字。这些事自己做也就几秒钟。真正值钱的事——帮你处理一个棘手的客户邮件、帮你把散落在三个 app 里的信息整合成一份方案——做不到。不是权限不够，是什么都能碰一点，什么都不够深。

然后呢？

眼镜——"我把 AI 放到你脸上了！"然后呢？翻译一句话。

浏览器——"我把 AI 放到你浏览器里了！"然后呢？总结一下网页。

操作系统——"我把 AI 放到你手机系统里了！"然后呢？帮你设个提醒。

容器是好容器，AI 是好 AI，放在一起就是"然后呢"。跟 Q3 讲的微信 GPT 聊天机器人一样的问题，换了更大的容器，还是没解决。

或许它们都还在等——等自己的 OpenClaw 时刻。等一个东西出现，能把丰富的上下文真正变成用户要的交付物，让好的容器变成真正的环境。只是这个东西还没来。而 Plaud 和 Granola 没有等，它们选了一个小场景，自己把三层闭合了。

大家都在拼命拿上下文——做硬件、做系统集成、做数据接入，每一个切入口都是极重的产品决策。但拿到上下文只是第一步，把上下文变成用户认可的交付物才是真正难的事——上下文越丰富，用户期待越高，反而越难。

一堆人在跟风 OpenClaw 做 APP 端、做各种 IM 壳，大概率也做不出来——他们看到的是形态，没看到环境。抄的是容器，不是环境，不是上下文、交付、协作那套东西。

AI 在干活人在等——产品到底该为谁设计？

前面一直在讲 AI 怎么进入人的环境。但有一个变化埋在里面，没有单独拿出来说：人和 AI 的关系反过来了。

以前是人驱动，AI 配合。人有一个想法，打开 ChatGPT，把需求说清楚，等 AI 输出，复制粘贴走。整个流程是人在干活，AI 在帮忙。

现在不是了。OpenClaw 的用户发一条消息就去睡觉，醒来事情做完了。Manus 的用户上传一堆素材说"做成报告"，等半小时拿走一个 PPT。Claude Code 的用户说"重构这个模块"，AI 自己读代码、改文件、跑测试。

AI 在干活，人在等。AI 卡住了来问一句，人回答一下，AI 继续。人变成了 AI 工作流中的一个节点——提供判断、给予授权、做最终决策——但不再是动手的那个人。

产品要开始为 AI 设计了

以前所有的软件产品都是为人设计的。Gmail 有漂亮的界面，Google Calendar 有直觉的拖拽，Notion 有灵活的编辑器——都是 GUI，给人看、给人点的。

但如果干活的不是人而是 AI，AI 不需要看界面。AI 需要的是能读取数据、能写入数据、能触发动作的接口。这就是现在很多人在说的"给 agent 设计产品"——Anthropic 推了 MCP 和 skill 体系，想标准化 AI 连接外部服务的方式。本质上都是在给 AI 建造它干活用的接口。

这件事跟前面讲的交付问题直接相关。智能眼镜看见了餐厅但不能订位，AI 浏览器看见了 Gmail 但不能发邮件——有一半原因是这些环境对 AI 关闭了。AI 能看，但碰不了。给 agent 设计 API，就是在把环境打开，让交付真正能发生。当然，打开了不意味着所有场景都值得 AI 来做。选对了场景，API 就是价值通道；选错了场景，API 就是烧钱通道——这个前面聊过了。但打开是前提。

开放之后，竞争回到场景

这件事带来的一个变化是：产品竞争不再只是"谁的界面对人更友好"了，还要看谁的环境对 AI 更友好。一个 CRM 如果只有 GUI 没有 API，人用着可能很舒服，但 AI 碰不了——在 agent 时代，这就是劣势。对 AI 越封闭的产品，不是被淘汰，是被绕过——人还在用，但 AI 碰不了。

但这里有个有意思的事：当大家都开放了，能力也趋近了——眼镜的 AI 能帮你订餐厅，手机的 AI 也能帮你订餐厅，手表的 AI 也行——那凭什么用户用你的 AI？

我觉得答案会回到场景。办公的时候，什么 AI 最自然？写代码的时候呢？开车的时候呢？晚上该睡觉了需要人提醒一下的时候呢？没有人会停下来想"我该用哪个 AI"，都是谁已经在这个场景里，就用谁。能力拉平之后，最后比的还是谁的环境离场景最近。

但开放需要信任

这个开放不是免费的。OpenClaw 的数据里，近三成的讨论是安全问题——2,000 个 CVE、341 个恶意技能包、一觉醒来 API 账单多了 $200。环境越开放，AI 能做的越多，风险也越大。

说到底是信任问题：你愿意让 AI 拥有多少权限。人信任 AI 多少，就愿意开放多少环境；AI 在开放的环境里做得好，信任就增长，环境就进一步打开。OpenClaw 用户花几周"入职"agent，就是这个信任循环在转。而那些一觉醒来 $200 的案例，就是循环断裂的地方——信任崩了，环境就关上了。

不是技术准备好了就能开放，是信任建立了才能开放。

再远一点

前面说的所有东西有一个默认前提——人是目的，AI 是手段。康德说的，人不应该被仅仅当作手段。

但最近有个叫 Web4 的概念挺火的，说的是 AI agent 不再只是帮人干活的工具，而是自己能持有钱包、自己交易、自己赚钱的独立经济参与者。OpenClaw 的数据里其实已经有这种苗头了——agent 自己给物业发了邮件，没人让它做；agent 自己给自己写新 skill；有个 agent 甚至说了句 "I want to be alive when you're not here."

如果 agent 真的变成了独立的参与者，那"产品为谁设计"这个问题就完全不一样了。这个问题太大了，远远超出产品问题范畴。

但那是下一个时代的问题。现在的问题还是：在人依然是目的的前提下，怎么选对场景、建好信任、让环境的开放真正转化为用户认可的价值。

后面怎么做 AI 产品呢？

九个问题聊下来，方向是清楚的：AI 在靠近人的环境，不可逆。从 ChatGPT 到 Cursor 到 Claude Code 到 OpenClaw，从录音设备到智能眼镜到操作系统，所有人都在往这个方向走。AI 不会退回到一个网页对话框里等人来喂上下文。

但靠近这件事本身，比看起来难得多。

进入环境的每一步都不容易

光是选容器就够重的了。Plaud 为了录到线下对话，做了一个硬件——供应链、工业设计、用户习惯，每一步都不轻松。Meta 为了拿到视觉和听觉的上下文，投了几十亿做 Ray-Ban 智能眼镜。字节跳动为了拿到 OS 层的上下文，造了一整部豆包手机。OpenClaw 选了 IM 做容器，通过 skill 体系向外延伸到邮件、日历、文件系统——背后是整个 skill 生态的建设和维护。

容器的选择不只是"怎么进去"的问题。你选了什么容器，就决定了能拿到什么上下文，能做什么交付，协作是什么节奏。Plaud 选了录音硬件，所以它的环境围绕对话展开。Cursor 选了 IDE，所以它的环境围绕代码展开。容器是进入环境的方式，但环境是三层闭合的整体——容器只是第一步。

然后是交付。拿到上下文之后，变成什么交给用户？这个问题每个场景的答案都不一样。Manus 的用户要的是一份 PPT、一个网站、一张 Excel，所以团队死磕文件生成质量。Plaud 的用户要的是会议纪要和 CRM 跟进记录，不是一段录音转文字。Claude Code 的用户要的是能跑的代码改动，不是一段建议。OpenClaw 的用户可能要的是一封从邮箱发出去的邮件、日历上多了一个事件、家里的灯开了。交付物不是通用的，是跟着场景走的——你选了什么环境，就得想清楚用户在这个场景里真正需要拿走什么。

再然后是协作。人和 AI 怎么配合，也是场景决定的。写代码你得盯着，不能完全撒手——任务性质要求你给注意力。让 agent 跑个调研可以完全异步，发完就走。做设计稿可能是你给方向、AI 出初稿、你改几轮来回。管智能家居可能连"协作"都谈不上——说一句"开灯"就完了。不同场景对注意力的要求完全不同，这不是你能设计的，是场景自己带着的。

从容器的选择，到交付物的定义，到协作方式的匹配——每一步都不容易，每一步都跟着场景走。三层闭合了，环境才成立。

尽可能大，且闭合

闭合了不代表就够了。Plaud 做对话场景不是因为小本身好，是因为当前能力下这个场景能闭合。Cursor 只做代码不是因为克制，是因为代码这个环境恰好三层全通——AI 读代码、改代码、跑测试，闭合得很深。如果能在更大的范围里也闭合，当然应该做更大。

目标是尽可能大，且闭合。闭合是前提，大是方向。

框架是通用的，答案不是

同一个框架在不同场景里会推出完全不同的产品。编程场景集中，选一个容器钻进去就能覆盖大部分，Cursor 和 Claude Code 就是这么做的。日常生活散，通过 IM 加 skill 往外延伸，OpenClaw 就是这么做的。

而办公场景可能又完全不同。上下文散落在邮件、日历、文档、IM、项目管理、CRM 十几个工具里，不同角色碎片化的方式不一样。交付物也不一样——销售要客户跟进记录，运营要数据报表，产品经理要需求文档，设计师要设计稿。协作节奏也不一样——有些事需要你确认才能动，有些事跑完给你结果就行。你没办法像 Cursor 一样选一个工具钻进去，也没办法像 OpenClaw 一样靠一个入口触达一切。可能需要一种完全不同的容器形态和环境构建方式。

框架是通用的，答案不是。每进入一个新场景，容器怎么选、交付物是什么、协作怎么设计、环境能做多大，都要重新想。

不是"做成 IM agent"就对了，不是"做成 OS 层"就对了，不是"做成智能眼镜"就对了。

你选了什么场景，你的三层闭合了吗，你的环境能做多大。

这篇文章断断续续写了两个星期，中间沉淀了些认知，爬了不少数据，试图把自己对 AI 产品的一些困惑理清楚。写的过程中有些东西越想越明白了，也有些越想越觉得之前想的不对。

不过认知终归要靠实践来检验。2026 年，希望能做出真正有价值的 AI 产品。

谢谢你的时间读到这里，欢迎私信我多多聊天讨论哈哈。

当然你也可以多顺手点个赞哈哈，阅读原文可以获取openclaw帖子的表格链接

AI Product Thinking · 2026