OpenClaw 完成大众破圈,Hermes 接住深度使用:Agent 进入专业分工阶段-夜雨聆风

OpenClaw 完成大众破圈,Hermes 接住深度使用:Agent 进入专业分工阶段

这两天又去看了下 OpenClaw 的发展趋势以及当下的真实调用情况。

OpenClaw 的微信指数从 3 月前后的接近 1.6 亿量级回落，Google Trends 从 3月的热度100 到 6月已经热度降了 92% 剩下 8 左右。

从微信指数，以及 Google Trends 热度趋势不难看出，OpenClaw 的热度已经如潮水般退去，全民围观式的声量已经过去。

但是，声音小了并不是代表没人用了。

从 OpenRouter 的真实调用量来看，OpenClaw 的 Global Ranking 周排行高居第3，tokens 周消耗量仍有 1.15T

也就是说，退掉的是社交热度，不是 Agent 需求本身。

3 月前后，朋友圈、微信群、公众号、小红书都在讨论“养虾”。很多人第一次听说，原来 AI 不只是在聊天窗口里回答问题，还可以接进微信、Telegram、Slack、文件系统、浏览器和脚本，替你真正执行任务。

到了 6 月，围观少了，截图少了，教程转发也少了。但真实调用仍在继续，只是从大众话题转向了更重、更稳定的工作流。

OpenClaw 完成了大众破圈，Hermes 接住了深度使用，Agent 正在进入专业分工阶段。

要点速览

先把判断放在前面。

1. OpenClaw 的大众声量退了，但调用没有消失。 微信指数和 Google Trends 都能看到回落，OpenRouter 上的 Today 排名和 Usage 数据又说明，它仍然有持续工作流在跑。
2. Hermes 接住的是更深一层的使用。 它不是简单替代 OpenClaw，而是更贴近长期记忆、技能沉淀、CLI 场景、多模型路由和稳定工作台。
3. Agent 正在从“万能助手想象”转向专业分工。 OpenClaw 的价值是让 Agent 完成大众破圈，Hermes 的价值是把 Agent 往深度工作流里推；下一阶段要看的不是谁最火，而是谁在具体任务里跑得久。

一、声量退潮是真的，先把事实摆稳

先承认一个事实：OpenClaw 的大众热度确实退了。

这个变化有数据支撑。

OpenClaw 的曲线在 2 月底到 3 月初快速拉升，峰值接近 1.6 亿量级，之后一路回落，到 6 月中旬已经接近低位。

Google Trends 的全球数据也类似。

在单独查询 Openclaw 时，它在 2026 年 3 月 8 日这一周达到峰值 100。到 2026 年 6 月 7 日这一周，已经降到 8。

它们共同说明一件事：OpenClaw 的大众围观期结束了。

这很正常。

OpenClaw 和普通聊天应用不同。普通聊天应用打开就能用，最多换几个提示词。OpenClaw 要部署、配置模型、接入渠道、管理 API Key、处理权限，还要维护 workflow。

最早那一波热度里，很多人不是带着稳定场景来的，而是被一个强画面击中了：

在微信里发一句话，远程那台电脑开始替你查资料、读文件、整理报表、跑脚本。

这个画面足够强，强到很多人还没想清楚自己到底要用它解决什么问题，就先点了 star、收藏了教程、找人代部署，甚至发朋友圈说自己也“养虾”了。

等真正跑起来，问题就开始出现：

Token 账单怎么算？脚本跑失败怎么办？文件权限给到哪里才算安全？它读错上下文、执行错命令，谁来兜底？用它做些什么事情？是否愿意持续折腾维护这个 Agent？

这些问题一出现，围观用户自然会离场。

所以 OpenClaw 的热度回落，不奇怪。它从一个全民话题，回到了工具本身该面对的问题：谁真的需要它，谁愿意维护它，谁能把它放进稳定工作流。

二、热度退了，但真实调用还在

如果只看声量，就会误判 OpenClaw 的状态。

真正要看的第二层，是真实调用。

从 OpenRouter 上的调用量以及 Tokens 真实使用量显示，OpenClaw 在全站 Today 排名第 3，显示 171B tokens。它的单项目 Usage 页面显示，OpenClaw 过去 30 天总量为 5.06T tokens，Daily Global Rank 为第 3，Active since 为 2026 年 1 月，Models used 为 384。

OpenClaw 过去 30 天使用量最高的模型包括：

排名	模型	token 用量
1	MiniMax M3	704B
2	DeepSeek V4 Flash	376B
3	Claude Sonnet 4.6	374B
4	Owl Alpha	341B
5	Nemotron 3 Super	290B

这组数据说明，OpenClaw 仍然有真实工作流在跑。

3 月那种人人围观的阶段已经过去。现在的 OpenClaw，更像是从“全民看热闹”，进入了“少数人持续跑工作流”的阶段。

这两种状态完全不同。

全民看热闹时，大家关心的是：

它够不够新？够不够酷？我也能部署一个吗？能发一张截图证明自己跟上了吗？

持续跑工作流时，用户关心的是：

它每天是否稳定完成任务？模型怎么选最划算？任务失败怎么回滚？哪些步骤交给脚本，哪些步骤交给 Skill，哪些步骤交给 Agent？哪些权限可以开放，哪些权限必须隔离？

这才是工具真正进入工作流后的问题。

我之前写 OpenClaw 省钱攻略时，其实也遇到过类似问题。很多人把 OpenClaw 用贵，不是因为单个模型价格太离谱，而是因为工作流分工错了。

明明可以用脚本处理的重复动作，让模型一遍遍推理。明明可以沉淀成 Skill 的流程，每次都重新讲一遍。明明只需要便宜模型做整理，却让高价模型全程参与。

这类问题不会出现在围观阶段，只会出现在真正使用阶段。

所以我更愿意把 OpenClaw 的退潮理解成一次过滤。

被过滤掉的是社交货币。留下来的是工作流需求。

三、Hermes 接住的是深度使用

再看 Hermes Agent，就会更清楚这个变化。

OpenRouter 全站 Today 截图里，Hermes Agent 排第 1，826B tokens。OpenClaw 排第 3，171B tokens。按这个截图时点算，Hermes 的当日调用大约是 OpenClaw 的 4.83 倍。

图：OpenRouter Global Ranking，Hermes Agent 位列 #1，OpenClaw 位列 #3。

月度分类榜更明显。

在 Productivity、Personal Agents、CLI Agents 三个分类里，Hermes Agent 都排第一，月度 18.6T tokens。

OpenClaw 在 Productivity 和 Personal Agents 排第二，4.95T tokens；在 CLI Agents 排第三，排在 Hermes Agent 和 Kilo Code 后面。

图：OpenRouter Productivity 月度分类榜，Hermes Agent #1，OpenClaw #2。

图：OpenRouter CLI Agents 月度分类榜，Hermes Agent #1，Kilo Code #2，OpenClaw #3，说明 CLI / Coding 场景已经开始出现更明显的专业分流。

单项目 Usage 页面也能看到差距：

项目	过去 30 天 tokens	Daily global rank	Models used
Hermes Agent	19.1T	#1	383
OpenClaw	5.06T	#3	384

图：Hermes Agent 单项目 Usage 页面，过去 30 天总量 19.1T tokens，并显示 Daily Global Rank #1。

这不是简单的“新工具替代旧工具”。

Hermes 接住的是另一类需求：长期记忆、技能沉淀、CLI 场景、多模型路由和更稳定的工作环境。

OpenClaw 解决的是一个很强的入口问题：让 Agent 进入用户熟悉的消息渠道，接到 WhatsApp、Telegram、Slack、Discord、微信、QQ、iMessage、Signal 这些日常入口。

Hermes 更强调另一个方向：长期运行、经验记忆、技能沉淀、多模型路由，以及更稳定的工作台。

这就是从“能执行”走向“能积累”。

举个更具体的例子。

如果你只是想在聊天窗口里发一句“帮我整理今天的文件”，OpenClaw 的入口感很强。它把 Agent 放在你已经熟悉的消息界面里，降低了普通用户第一次接触 Agent 的门槛。

但如果你每天都要做一组复杂任务，比如：

• 抓取 20 篇文章
• 判断哪些值得收藏
• 转成 Markdown
• 提取观点
• 写入知识库
• 推送到 GitHub
• 下次写文章时还能检索和复用

这时你关心的就不只是“它是否执行过一次”。

你会关心它是否记住规则，是否复盘失败，是否把稳定流程固化下来，下一次是否能少问你几个问题。

这就是 Hermes 更容易吸引深度用户的地方。

从 OpenRouter 的模型分布也能看到这个趋势。Hermes Agent 过去 30 天用量最高的模型里，Owl Alpha 是 5T，DeepSeek V4 Flash 是 4.35T，MiniMax M3 是 1.28T，DeepSeek V4 Pro 是 1.23T。

这已经不是一个“选一个最强模型就完事”的用法。

深度 Agent 用户正在做模型组合：有的模型负责便宜高速的整理，有的模型负责复杂推理，有的模型负责代码，有的模型负责压缩和辅助任务。

Agent 进入高频使用以后，问题不再是“哪个模型最强”，而是“哪些任务应该交给哪个模型，怎么把成本、速度、质量和稳定性放到同一套工作流里”。

Hermes 的增长，正好说明这层需求已经开始成形。

四、OpenClaw 的历史意义，是让 Agent 走出程序员圈子

如果只用今天的 token 排名看 OpenClaw，会低估它。

OpenClaw 最大的意义，不是一直霸榜，也不是成为所有人的最终助手。

它更像一次交互想象的扩散。

Star-History 截图显示，到 2026 年 6 月 15 日，OpenClaw 仍有 378,834 stars。Hermes Agent 是 194,155 stars。OpenClaw 的累计关注仍然接近 Hermes 的 1.95 倍。

图：Star-History 中 OpenClaw 的 star 增长曲线，2026 年 6 月 15 日为 378,834 stars。

图：Star-History 中 Hermes Agent 的 star 增长曲线，2026 年 6 月 15 日为 194,155 stars。

这个数字不能直接证明 OpenClaw 会成为长期基础设施。GitHub star 在 AI 时代越来越像一种注意力投票：它能说明一个项目被多少人看见，却不能直接说明它会替代谁。

但这个数字能说明，OpenClaw 把“个人 AI 助手”这件事推到了一个非常大的公共视野里。

在 OpenClaw 之前，Agent 并不新。

开发者圈子已经讨论过 AutoGPT、LangChain、CrewAI、Claude Code、Codex、Cline、Devin。大家讨论 tool calling、planner、executor、memory、multi-agent，也讨论过很多轮。

但这些讨论大多发生在程序员语境里。

普通用户理解 AI，更多还是从 ChatGPT、DeepSeek、Kimi、豆包、元宝这些聊天产品开始。你问，它答；你写提示词，它生成内容。

OpenClaw 改变的是交互想象。

它让很多普通用户第一次看到：

AI 不只是回答问题。它可以接入消息。它可以读文件。它可以跑脚本。它可以操作浏览器。它可以替你完成一串动作。

这正是 Agent 从概念走向日常工作的关键一步。

因为普通用户不一定理解什么叫 tool use，不一定理解什么叫 harness，也不一定关心 Agent 架构。但他能理解一个画面：

我在微信里发一句话，它把报表整理好了。

这就是 OpenClaw 完成的大众破圈。

国内后来出现的百虾大战，也是在抢这个入口。

腾讯、字节、阿里、MiniMax 等公司都推出过 Claw 类产品或相关能力。腾讯有 WorkBuddy、QClaw、腾讯云 Lighthouse；字节有 ArkClaw、飞书相关部署能力；阿里有钉钉生态和办公场景。Claw123 这类导航站也收录了大量 Claw 相关项目和入口。

这些产品不一定都能留下来。

但它们同时出现，说明大厂和开发者都意识到一件事：如果 Agent 能跨软件执行任务，入口就不再只是 App、搜索框或聊天框，而是一个长期在线、可以调度工具的执行层。

OpenClaw 把这个问题摆到了台面上。

这就是它的历史意义。

五、Agent 的下一阶段，是专业分工

OpenClaw 完成的是大众破圈。Hermes 接住的是深度使用。

Agent 的下一阶段，也许不会再靠一个名字刷屏，而是慢慢嵌进一个个具体工作流。

普通人不缺一个“理论上什么都能做”的 Agent。真正有价值的是，一个 Agent 是否能稳定完成某个具体工作流。

比如：

• 每天早上整理邮件、飞书消息和待办，生成一页简报。
• 每天下午抓取行业新闻、竞品动态和投融资信息，生成投研草稿。
• 把选题、资料收集、封面提示词、正文初稿、发布时间和评论回复串成内容生产流水线。
• 在客服场景里读取工单、查询知识库、生成回复，并把不确定的地方标记给人工。
• 在开发场景里读代码、改 bug、跑测试、提交 diff，并在失败时给出可回滚路径。

这些任务没有“万能数字员工”听起来刺激。

但它们更接近真实需求。

Agent 的下一阶段，是专业分工，要优先看它解决的是工作流里的哪一层？

第一层，是入口。

它负责出现在用户本来就在工作的地方，比如微信、飞书、钉钉、Slack、Telegram、Discord。入口型 Agent 的价值不是最聪明，而是离用户最近。OpenClaw 完成破圈，靠的就是这一点。

第二层，是 CLI 和 Coding。

它负责开发、调试、自动化执行。这个方向里，Hermes、Kilo Code、Claude Code、Cline、Codex 这类工具都会继续分流。开发者会更关心代码理解、命令执行、测试反馈和项目上下文，而不是只看一次演示有多惊艳。

第三层，是记忆和技能。

高频使用 Agent 的人，很快会遇到同一个问题：为什么每次都要重新解释我的偏好、目录结构、写作规则、项目约束和工作流？

记忆和技能沉淀，解决的是重复沟通成本。它让 Agent 不只是执行一次命令，而是逐步理解一套工作方式。

第四层，是模型路由。

从 OpenRouter 数据可以看到，OpenClaw 和 Hermes 的 Models used 都在 380 个以上。这意味着深度 Agent 使用已经不是绑定一个模型，而是让不同模型承担不同任务。

便宜模型做整理，高质量模型做判断，快模型做预处理，强推理模型做关键决策。

未来成熟的 Agent，不一定是自己最强，而是知道什么时候该调谁。

第五层，是垂直工作流。

财务、客服、投研、内容、运营、法务、招聘、数据分析，每个场景都有自己的权限、流程、审核和失败成本。

越靠近真实业务，越需要专业分工。一个内容 Agent 要理解选题、素材、草稿、封面、发布时间和评论反馈；一个客服 Agent 要理解工单、知识库、人工转接和风险兜底；一个开发 Agent 要理解代码库、测试、提交规范和回滚路径。

这也是超级 Agent 叙事最容易被高估的地方。

一个什么都能做的 Agent，听起来很美。但一进入真实工作流，它马上会遇到权限边界、审计责任、成本控制、数据隔离、失败回滚这些问题。

在真实组织里，稳定比炫技重要，边界比想象力重要，长期维护比第一次演示重要。

Agent 的未来，不会只是一款更大的万能助手。

更可能出现的是一组分工明确的执行系统：有的负责入口，有的负责记忆，有的负责代码，有的负责知识库，有的负责模型路由，有的负责具体业务流程。

Agent 真正成熟的标志，不是它看起来像一个万能助手，而是它能在明确边界里，持续完成一类具体工作。

AI 趣实验出品谢谢你读我的文章，既然看到这里了，如果觉得不错，关注我，顺手点个赞、在看、转发三连吧～