4.7万星!这个AI助手凭什么挑战OpenClaw?

🚀 AITurbo

AI Agent · 自进化架构 · 长期记忆
本文阅读约8分钟

AI Agent圈内最近最热的话题，不再是OpenClaw又发布了什么新插件，而是一个叫Hermes的新名字。从2026年2月底开源首月突破2.2万星，到4月8日v0.8.0版本发布当天单日新增6400多星，Hermes Agent在不到两个月时间里，GitHub星标强势突破4.7万，连续多日霸榜全球开源趋势榜首。

这狂热数据背后，正在发生一场深刻的行业转折：AI Agent框架正在从"连接广度优先"走向"学习深度优先"。

长久以来，以OpenClaw为代表的早期框架习惯通过不断堆叠外部编排层来扩展AI的能力边界。但随着架构复杂度外溢、上下文管理效率低下、安全漏洞频发以及高昂的推理成本等问题日益凸显，这种高度依赖外部路由的模式已经显现出难以逾越的瓶颈。

🎯 Hermes Agent是什么——一个"越用越强"的自进化AI

传统软件工程认知中，AI助手往往被设计为无状态的工具调用器，每一次对话开启都等同于系统状态重置。而Hermes Agent被明确定义为一个"运行在你服务器上的自主Agent"——它不仅是多渠道的执行终端，更是一个能够随着时间推移不断沉淀数字资产、深化对用户理解的私人AI基础设施。

结合官方技术文档与社区工程反馈，Hermes展现出了六大标志性核心特性：

• "与你同在"的跨平台陪伴能力。Hermes放弃了臃肿的独立Web前端，通过高度集成的Gateway进程直接连通各类即时通讯工具。开发者可以通过Telegram、Discord、Slack、WhatsApp、飞书以及企业微信等平台直接与Agent交互。

• "越用越强"的内置学习闭环。这是Hermes区别于市面上所有套壳产品的灵魂所在。它并非静态地调用API，而是能够从每一次失败与成功的执行经验中自动提取逻辑、创建可复用的技能文件，最终实现从"记忆沉淀技能"到"技能反哺训练"的完整闭环。

• 定时自动化与委派并行。系统内置基于自然语言驱动的Cron调度器，你只需发送口语化指令，Agent便会在后台无人值守地持续执行任务。

• 沙盒隔离与全网页控制。系统为终端工具提供了包括Docker容器、SSH远程协议在内的六种后端环境，确保所有高风险的代码和命令都在严格的隔离空间中运行。

• 极低的部署成本。得益于精简的底层状态机架构，它可以流畅地运行在每月仅需5美元的普通VPS服务器上。

• 极度开放的模型接入。v0.8.0版本引入了全平台实时的模型切换能力，系统无缝对接超过200种大模型，包括免费层级的小米MiMo V2 Pro模型。

🔬 自进化如何实现——三层学习闭环的技术拆解

赋予一个数字系统类似于人类的"经验累积"与"方法论沉淀"能力，需要极其精密的底层架构支撑。Hermes的核心技术壁垒在于其深度解耦且环环相扣的"三层学习闭环"。

Hermes三层学习闭环架构

第一层：持久化记忆与用户心理建模

市面上绝大多数的Agent在会话结束后即丢失上下文。而Hermes构建了一套由Agent自主管理的持久化记忆系统，所有的历史会话、执行命令与工具返回结果保存在本地的SQLite数据库中，并通过FTS5引擎启用高性能的全文检索支持。

这套记忆系统的精妙之处在于其创新的"定期轻推"机制。Agent在运行时维护着两个极其精简的核心Markdown文件：MEMORY.md（记录客观环境信息、开发约定与历史教训）和USER.md（记录用户个人偏好与沟通风格）。

第二层：技能的自动生成与跨生态复用

如果说第一层的持久化记忆解决的是"事实与状态"的存储，那么第二层的技能系统解决的则是"方法论与程序论"的沉淀。这是Hermes与OpenClaw等传统框架最本质的技术分水岭。

Hermes的这一能力高度依赖于其内置的skill_manage核心工具。当Agent满足以下触发条件时，会自动启动技能生成流程：

• 复杂任务的成功执行（涉及5次及以上工具调用）

• 错误修复与死胡同突破

• 人类干预与人工纠正

• 非平凡工作流的自主发现

在格式规范上，Hermes全面拥抱了由Anthropic主导并开源的agentskills.io标准。为了解决技能库不断膨胀导致的上下文爆炸问题，Hermes采用了"渐进式披露"加载模型，能够将包含数百个工具的庞大技能集所带来的上下文消耗降低约96%。

第三层：自训练能力雏形与轨迹微调

Hermes自进化架构的最底座，是其直接对接到大模型强化学习与权重微调的反馈能力。它不仅在应用层"使用大模型"，更在系统底层作为一台不知疲倦的"数据织布机"，持续生成高质量的微调语料。

在Agent的实际运行生命周期中，所有的交互过程都会被打包记录，通过系统内置的批处理运行器，自动转换为兼容ShareGPT标准的JSONL格式。这种架构设计意味着你可以先用旗舰模型运行数周收集完美执行轨迹，然后导出数据对小尺寸开源模型进行微调训练。

📊 为什么Hermes在这个时间点爆发——OpenClaw瓶颈渐显

要深刻理解Hermes Agent为何迎来GitHub星标的指数级暴涨，就必须将其置于整个AI Agent行业生态正经历的剧烈阵痛期中进行审视。在此之前，OpenClaw无疑是开源Agent界绝对的统治者。

OpenClaw在短短33天内便超越了React框架，成为GitHub历史上达成最高星标数最快的软件项目。在最高峰时期，48小时内狂揽34,168颗星，平均每小时新增710星。然而，随着企业级用户将其投入到真实业务中，这种依赖"外部编排驱动"的设计逐渐暴露出难以逾越的瓶颈。

上下文浪费与"数十倍"的成本巨坑

2026年4月上旬，小米大模型负责人罗福莉发表了一篇深度解析文章，直接从底层工程成本的维度，撕开了围绕在OpenClaw表面的繁荣泡沫。

罗福莉尖锐地指出，OpenClaw在系统的上下文管控上存在严重的设计浪费。由于"什么都存"的全量持久化策略，且缺乏动态提纯与压缩机制，每次API请求的上下文窗口动辄超过10万个Tokens。真实推理成本可能达到订阅价格的"数十倍"。

成本巨坑：OpenClaw的真实推理成本

一位Reddit用户公开了监控日志：在短短20天内，仅运行四个后台Agent，就烧掉了420美元的API费用。即便是后台心跳包，OpenClaw也会默认拉起满载历史文件的数十万Tokens上下文，并调度最昂贵的前沿旗舰模型处理。

外部政策的致命一击与安全性崩塌

让OpenClaw的架构瓶颈彻底引爆的，是模型底层提供商的政策收紧。Anthropic等头部厂商宣布全面切断第三方框架通过普通用户订阅渠道"薅羊毛"的调用路径，瞬间让大批重度依赖单一框架的开发者陷入业务瘫痪。

雪上加霜的是，OpenClaw过于庞大、松散且追求极速扩张的生态带来了灾难性的安全危机。在2026年第一季度的短短63天内，安全研究人员就披露了多达138个CVE漏洞，其中包含7个CVSS 9.0+的严重漏洞。

OpenClaw安全危机：63天138个CVE漏洞

最具破坏性的CVE-2026-25253是一个零点击远程代码执行漏洞（CVSS 8.8）。攻击者只需诱使受害者访问恶意网页，便能完全接管整个Agent系统。网络扫描数据显示，全球暴露在公网的63%实例没有开启最基础的网关身份验证。

供应链攻击同样触目惊心：安全研究机构对插件市场ClawHub进行全面审计，在2857个可用技能中，扫描出341个恶意技能，生态感染率高达12%。

小米MiMo的底座协同与基建破局

罗福莉明确指出：单纯依靠价格战并不能填平工程效率低下的巨坑。行业唯一的出路，是建立在"更高Token使用效率的Agent架构"与"更强大的底层基础模型"之间的协同进化之上。

小米直接亮出了底牌——旗舰级智能体底座模型MiMo V2 Pro。这是一款拥有超过1万亿总参数、420亿激活参数的MoE架构庞然大物，专门针对Agent核心场景进行强化学习后训练。在权威Agentic评估榜单ClawEval中斩获61.5分，直逼Claude Opus 4.6（66.3分）。

MiMo V2 Pro vs Claude Opus 4.6

最具深远意义的是，小米直接选择了与Hermes Agent进行深度技术整合。在Hermes v0.8.0版本中，官方控制台直接向所有开发者限免开放了MiMo v2 Pro的调用权限。这种"极简高效框架 + 廉价强力模型"的软硬协同组合，完美印证了协同进化的论断。

🔄 行业转折点——Agent生态从"一家独大"走向"开放竞争"

Hermes的崛起标志着AI Agent生态正式跨过了一个至关重要的历史拐点。过去一年里，行业围绕OpenClaw近乎形成了盲目追求插件数量与广度接入的单一共识；而今天，生态正式迈入了一个注重架构内聚效率、协议开放标准化以及技术纵深自驱的"多强并存、开放竞争"新时代。

拥抱开放标准与解耦的生态繁荣

当AI Agent的定位从简单的单轮短期任务助手，演变为能够全面接管你桌面、独立进行跨文件庞大代码库重构的"长期运行的个人生产力系统"时，内存的精细化管理、学习能力的可复用性以及知识资产的标准化，便不可逆转地取代了单纯的"能连多少个App"。

Hermes展现出了令人钦佩的开放格局。它在技能生态上全面拥抱并深度集成了agentskills.io这一由Anthropic无偿贡献给开源社区的公共规范。

MCP vs Agent Skills：分工界限

在现代Agent架构的发展中，MCP与Agent Skills已经形成了明确的分工界限：MCP赋予AI Agent与外部真实世界互动的"手和脚"，而Agent Skills则构成指导AI如何运用工具进行专业分析的"大脑与方法论"。

这种"一次编写，到处执行、终身受用"的知识流转范式，彻底击碎了由单一巨头框架垄断用户数字技能资产的可能。

Web3极客基因与去中心化算力的宏大图景

Hermes背后的开发团队Nous Research身上流淌着浓厚的Web3去中心化极客基因。这支以"去中心化AI研究实验室"为定位的团队已累计获得超过6500万美元融资，领投方正是加密货币领域的顶级资本Paradigm。

Nous Research正在推进一项极具野心的底层计划——Psyche分布式训练网络。这是一个构建在Solana区块链之上的去中心化大语言模型训练基础设施。团队自研的DisTrO协议能够将GPU节点间网络通信带宽需求降低1000倍甚至10000倍。

Hermes 4.3 36B模型是世界上首个完全在Psyche网络上，利用全球消费级GPU节点进行联合分布式后训练的工业级大模型。这种将"系统日常使用过程"转化为"数字资产积累过程"的潜在机制，正在深刻改变对AI Agent产品生命周期的终极估值逻辑——Agent不再是工具，而是数字劳动力的载体。

💡 结语

OpenClaw以其令人惊叹的生态连接能力，出色地完成了向全世界普及"什么是自主AI Agent"的先驱启蒙使命。然而，当技术初见时的惊艳褪去，面对动辄耗资数百美元的冰冷API账单，以及可能导致企业内网全线崩溃的安全信任危机，工程学最本质的效率理性必然会重新夺回行业发展的主导权。

Hermes Agent以其独创的三层学习闭环提出的"越用越懂你、越用越强大"进化方向，正是整个AI Agent生态从新奇的概念性"玩具"，彻底蜕变为工业级"生产力工具"，必须跨越的那道关键历史鸿沟。

📚 往期精选

• 为什么你的AI能操控电脑了？Claude Code这次更新太狠

• 测了Gemma4，我有点震惊：单卡119 tokens每秒，这个开源模型比云端还快

你在工作中遇到过类似问题吗？
欢迎留言聊聊 👇

点「在看」让更多人看到 👀

👍

👀

在看

📤