为什么OpenClaw,Hermes这类通用Agent越来越像Coding Agent


最近看 Openclaw、Hermes 这类通用 Agent 项目,会有一个很有意思的感觉:它们明明不是专门写代码的工具,但内部架构却越来越像Claude Code、Codex、Cursor Agent 这类 Coding Agent。
这不是巧合。
更准确地说,Coding Agent 可能不是一个垂直赛道,而是通用 Agent 的早期形态。


过去我们说 AI,大多数时候是在聊天:你问一句,它答一句。
但 Coding Agent 不一样。
它不只是回答你 “这个 bug 可能在哪里” ,而是会真的去读文件、搜索代码、修改代码、运行测试、看报错,然后继续修。
这套流程非常关键:
理解任务,拆解步骤,调用工具,观察结果,继续执行,直到交付。
这其实就是 Agent 最核心的工作方式。
为什么写代码最先跑通?因为代码环境天然适合 Agent。
代码有文件系统,有命令行,有测试结果,有报错日志,有相对明确的成功标准。模型做错了,可以通过测试反馈继续修。这个闭环,比很多开放式任务更容易验证。
所以 Coding Agent 率先把 “AI 怎么真正干活” 这件事跑出来了。


Openclaw 更像一个个人 Agent 网关。
它把 Telegram、Slack、WhatsApp、iMessage 等聊天入口,统一接到一个可以长期运行的 Agent 上。你不一定坐在电脑前,也可以从手机上让 Agent 帮你处理任务。
Hermes 更像一个通用 Agent 内核。
它有记忆、技能、工具调用、会话管理、定时任务、插件系统,也能接入不同入口和不同模型。
你会发现,它们和 Coding Agent 的底层结构非常接近:
有入口层,负责接收用户指令。
有 Agent 核心,负责理解目标和规划下一步。
有工具系统,负责调用文件,终端,浏览器,API,MCP。
有记忆系统,负责保存用户偏好,历史任务和上下文。
有技能系统,把常见任务封装成可复用能力。
有权限和沙箱,防止 Agent 乱读文件、乱跑命令、乱调用接口。
这就是重点:
通用 Agent 不是在模仿 Coding Agent,而是大家都在逼近同一个答案。
真正能干活的 AI,最后都需要这套架构。

今天很多人对 Agent 的理解,还是”一个更聪明的聊天机器人”。
但 Openclaw、Hermes、Claude code、Codex 代表的是另一种方向:
Agent 会变成一个长期存在的执行环境。
它可以从聊天软件被唤起,可以在终端里工作,可以进入 IDE,可以操作浏览器,可以调用公司内部系统,也可以长期保存记忆和技能。
以前你打开一个 APP 来完成任务。
未来可能是你告诉一个常驻 Agent:
“用我们的发布流程,把这个版本发到 staging。”
“用法务初审流程,看一下这个合同”
“用投研模板,分析一下这家公司。”
“查一下过去三个月客户流失原因,整理成报告。”
Agent 自己决定调用哪个工具、加载哪个 Skill、需不需要浏览器、需不需要数据库、需不需要人工确认。
这时候,Agent 就不再是一个应用,而更像数字世界里的操作层。

如果这个趋势成立,2026 年下半年 Agent 赛道很可能发生一次明显分化。
很多浅层专业 Agent 会被压缩。
比如一些只靠提示词包装出来的 “周报 Agent” “小红书标题 Agent” “简历优化 Agent” “会议总结 Agent”,如果没有独家数据、复杂工作流、专业权限和交付闭环,很容易被更强的通用 Agent吃掉。
因为通用 Agent 加上好模型、搜索、文件处理、表格、浏览器和工具调用,已经可以直接完成这些任务。
用户不会愿意为了每个小任务打开一个独立 Agent。
更自然的方式是:在一个通用 Agent 里,调用不同技能。

这可能是更重要的变化。
很多专业 Agent 不会作为独立产品存在,而是变成通用 Agent 的 skill。
什么是 skill?
你可以把它理解成一套可复用的专业流程:里面有任务说明、操作步骤、检查清单、示例、工具调用方式、行业知识和交付格式。
比如:
投研日报 Agent,可能变成一个投研 skill。
PRD 评审 Agent,可能变成一个产品评审 skill。
合同初审 Agent,可能变成一个法务检查 skill。
客服质检 Agent,可能变成一个质检 skill。
数据分析 Agent,可能变成一个 BI 分析 skill。
用户不再单独打开这些 Agent,而是让通用 Agent 在合适的时候加载它们。
这会让 Agent 市场从 “应用市场” ,逐渐变成 “技能市场 + 工具市场” 。

当然,不是所有专业 Agent 都会消失。
能留下来的,大概率是那些有硬壁垒的系统。
比如有独家数据的,像金融、医疗、供应链、企业知识库。
有强流程的,像审计、报税、采购、法务、投放。
有权限和合规要求的,像保险理赔、合同签署、医疗建议。
有复杂业务界面的,像 ERP、CRM、BI、CAD、实验系统。
这些不会被一个 prompt 轻易替代。
但它们也会被迫接入通用 Agent 生态,变成“专业系统 + Agent 接口”的形态。
换句话说,未来专业产品的价值,不一定是自己做一个封闭 Agent,而是让更强的通用 Agent可以安全、可靠地调用自己。

过去大家比的是:谁做了更多 Agent。
接下来可能比的是:谁能成为 Agent 的运行底座。
谁有更好的模型,谁有更稳定的工具调用,谁有更完整的记忆系统,谁有更安全的权限管理,谁有更多高质量 Skills 和 MCP 工具,谁就更接近下一代入口。
这也是为什么 OpenClaw、Hermes 这类项目值得关注。
它们不是简单做一个 “万能助手” ,而是在搭建 Agent 运行时:
多入口接入,长期记忆,技能复用,工具调用,权限隔离,任务循环。
这些东西听起来没有 “一个爆款应用” 那么性感,但它们可能才是 Agent 真正落地的基础设施。


OpenClaw、Hermes 这类通用 Agent 越来越像 Coding Agent,并不是因为它们的目标都是写代码。
而是因为 Coding Agent 率先跑通了“AI如何真正完成任务“的底层范式。
下半年的 AI 发展,很可能不会是出现更多独立 Agent,而是出现更强的通用 Agent 基座,以及围绕它们生长出来的 skills、MCP 工具、子 Agent 和专业工作流。
未来专业 Agent 要回答一个很现实的问题:
你到底是一个必须独立存在的产品,还是只是一个可以被通用 Agent 调用的技能?
这个问题,可能会决定下一波 Agent 产品的生死。
点击以下链接,关注我
山芋,人工智能时代的艺术家
头部科技公司AI产品经理
持续分享人工智能相关知识
希望你我都是各自领域优秀的创作者

夜雨聆风