OpenClaw 已落后,两个月60k Stars,AI圈杀出又一黑马:这个让大模型“学会成长”的开源框架凭什么?

说实话，我第一次看到这个数据的时候是不信的。两个月，60k Stars，单日新增6400+，霸榜全球开源热榜第一。你要说这是某个大厂的重磅产品我信，但你告诉我这是一个名不见经传的研究团队从零开始做出来的？我第一反应是，数据刷的吧？

但当我真正深入去看这个项目，看它的设计理念、技术实现，看他们团队在Issue区和讨论区跟用户的互动方式，我服了。这不是运气，这是真东西。

这个项目叫 Hermes Agent，来自 Nous Research。核心卖点就一句话——“会自我成长的AI”。不是那种PPT上画饼的“自我进化”，是真正内置学习闭环的：它能从你交给它的任务里自动提炼出可复用的技能，能记住你的偏好和习惯，能跨会话精准回忆之前讨论过的内容，甚至还能把自己运行中产生的工具调用轨迹导出来微调模型。

这意味着什么？意味着你用得越久，它就越懂你。意味着一个真正意义上“越来越好用”的AI助手，不是靠你手动喂数据，而是它自己学会的。

今天我们就来好好扒一扒这个项目，看看它到底是怎么做到的，以及为什么我认为它代表了AI Agent框架的一个新方向。

1. 从“工具调用”到“真正的助手”：一个困扰行业很久的问题

在说Hermes Agent之前，我想先聊聊为什么它让我眼前一亮。

过去两年，AI Agent的概念火得一塌糊涂。从LangChain到AutoGPT，从CrewAI到各种国产框架，你能看到无数“智能助手”被造出来。但说实话，用过之后你会发现一个很尴尬的事实：它们都不够“智能”。

不是模型不够强——GPT-4、Claude 3.5的能力摆在那里。问题在于，这些Agent框架本质上还是“更高级的工具调用器”。你让它做一件事，它就做一件事。做完了，结束。下次遇到类似的场景，它不会因为上次做过了就更快更好。它没有记忆，没有经验，没有“学会”。

更让人头疼的是偏好问题。我见过太多团队在企业内部部署AI助手，每个员工的习惯、工作方式、专业领域都不一样。理论上AI应该适应人，但实际上，每次对话都是从零开始。你想让AI记住“你是XX部门的，偏好用XX方式输出结果”？做梦。关掉对话窗口，一切归零。

这就引出了一个根本性的问题：AI Agent框架的核心价值，到底应该是“让模型调用更多工具”，还是“让模型真正学会理解任务、积累经验、持续进化”？

大多数框架选择了前者。Hermes Agent选择了后者。

2. Hermes Agent全景：它到底是什么，能解决什么问题

先给不了解的朋友做个简单介绍。Hermes Agent是Nous Research团队开发的一个AI Agent框架，2026年2月底开源，到现在也就几个月时间。但就是这几个月，它从GitHub的角落里一路杀到了全榜第一。

它的定位很有意思——不是要做“更强力的任务执行器”，而是要做“有记忆、会学习、能进化”的AI伙伴。官方自己的描述是"The agent that grows with you"，翻译过来就是“和你一起成长的Agent”。

那它具体是怎么做到的呢？我总结了一下，它有三大核心能力：

第一，持久化记忆系统。 这是它跟其他框架最大的区别。大多数Agent框架的“记忆”其实就是对话历史(Context)，撑不过一个会话窗口。Hermes Agent不一样，它有真正的持久化存储——会把用户信息、任务上下文、关键决策都存下来，而且支持全文检索。更厉害的是，它还能用模型自动对记忆做摘要压缩，防止信息爆炸，同时建立跨任务的关联，让“经验”真正能被复用。

第二，技能自动生成与复用。 这是它自我进化的核心机制。当你让Hermes Agent完成一个任务后，它不会就此结束。它会分析这次任务的执行过程，把其中有价值的步骤、判断逻辑、潜在坑点抽象出来，生成一个结构化的Skill。这个Skill不是给人类看的说明文档，而是它自己下次遇到类似任务时能直接调用的“经验”。你用得越多，它会的越多。

第三，自训练雏形。 这个更激进。它在运行过程中会记录工具调用的轨迹数据，这些数据是可以导出来用于模型微调的。什么意思？就是你在用它完成任务的过程中，其实也在为它生成训练数据。它越帮你干活，它就越“聪明”。虽然现在还只是雏形阶段，但这个方向想象空间太大了。

除了这三大核心能力，它还有几个很实在的亮点：

部署方式极其灵活，支持200+大模型一键切换，本地/Docker/SSH/Daytona/Singularity/Modal六种部署方式。官方甚至说，5美元的VPS就能跑起来全部功能。这对于个人开发者和中小企业来说太友好了。

多平台接入，主流的Telegram、Discord、Slack、WhatsApp、Signal都能连。这意味着你可以把它部署成真正的“私人助手”，随时通过你习惯的IM工具调用。

有意思的是它和OpenClaw（就是那个被大家叫“龙虾”的框架）的互补定位。用官方的话说，OpenClaw负责“干活”，Hermes负责“动脑”。如果你已经在用OpenClaw，可以一键迁移（hermes claw migrate）。这种开放的态度在开源社区里挺难得的。

3. 诞生背景：不是凭空出现的，它有清晰的技术脉络

Hermes Agent不是凭空冒出来的，它的背后是Nous Research这个团队在LLM Agent方向上的长期积累。

Nous Research可能有些人不熟悉，这是一家专注于大语言模型研究的机构，创始团队成员有在Anthropic、OpenAI等公司工作的背景。他们之前就开源过不少项目，在AI圈子里有一定口碑。Hermes系列是他们的大语言模型产品线，之前的Hermes 2、 Hermes 3在开源社区都反响不错。Hermes Agent是把Hermes模型能力产品化、做成一整套Agent框架的尝试。

从技术演进的角度看，Hermes Agent解决的是一个很实际的问题：单纯的模型能力已经遇到了瓶颈，业界开始意识到，决定Agent实际表现的关键不只是模型本身，还有框架层面的设计——如何让模型更好地利用工具，如何让模型真正理解任务目标，如何让模型积累经验而不是每次都从零开始。

在这样的背景下，Hermes Agent的定位就很清晰了：它不是又一个“功能堆砌型”框架，而是试图在Agent架构层面做出创新，真正解决记忆、学习、进化的问题。

从时间线来看，2026年2月底开源v0.1.0，3月初快速迭代到v0.5.0、v0.6.0，3月中旬发布v0.8.0引爆全网，然后持续快速迭代到现在。社区反馈极其热烈，Issue区和讨论区都很活跃，团队响应速度也很快。这种节奏说明项目不是在“放出去就不管了”，而是真的在认真做产品。

4. 技术深潜：三大支柱的内在逻辑

好，前面说的都是“是什么”和“为什么”，接下来我们来好好扒一扒“怎么做”。这部分会比较硬核，但我会尽量用类比和故事讲清楚。

4.1 持久化记忆系统：不只是存储，是一套认知架构

大多数框架的“记忆”就是个简单的KV存储，或者干脆用向量数据库做个语义检索。Hermes Agent不一样，它的记忆系统是一套有内在逻辑的架构。

首先，它把记忆分成了几层：即时记忆、短期记忆、长期记忆。即时记忆就是当前对话的上下文，这个好理解。短期记忆是跨会话但还在“热乎期”的信息，比如你上周让AI做的那个项目的一些细节。长期记忆则是经过提炼和整合的、稳定的知识，比如你的工作习惯、专业背景、偏好设置。

这个分层的意义在于：AI不需要每次都把所有的“历史对话”都塞进Context窗口，那样既浪费Token，效果也不好。AI可以根据当前任务的需要，动态地从记忆系统里检索相关信息，然后以“更高效的形式”呈现在上下文里。

检索机制是关键技术。 Hermes Agent用了全文检索+语义检索的组合。全文检索保证你能搜到精确匹配的关键词，语义检索则能理解你的查询意图。比如你说“上次那个关于xxx的项目”，它能自动关联到相关的记忆，而不是傻傻地告诉你“对不起，我没有找到包含’xxx’的对话记录”。

更厉害的是自动摘要和关联建立。记忆系统会定期运行一个“整理”过程，用模型来分析新存入的记忆，跟已有的记忆做对比，把冗余的信息合并，把相关的记忆关联起来。这就像你大脑里的“海马体”巩固记忆的过程——不是简单地把信息堆在那里，而是真正把它整合进你的知识体系里。

我见过一些框架也在做“记忆”，但大多数只是做了存储层，没有做这个“认知加工”的过程。没有这个过程，记忆就只是“日志”，不是“经验”。

4.2 技能自动生成：从“做任务”到“会方法论”

这是Hermes Agent最让我兴奋的部分，也是它“自我进化”能力的核心体现。

当AI完成一个任务后，它会进入一个“反思和学习”的阶段。不是你让它学，是它自己分析刚才的过程。

具体来说，它会拆解这个任务的执行流程：分几步走的，每一步的关键决策是什么，有没有什么坑点需要注意，怎么验证任务是否真的完成了。这些信息会被结构化地组织起来，形成一个叫做"Skill"的产物。

这个Skill不是给人类写的文档，而是AI自己可以理解和调用的“经验模块”。下次遇到类似任务，它不会傻乎乎地从第一步开始摸索，而是会直接调用这个Skill，参考之前的判断逻辑，甚至能复用之前的工具调用序列。

Skill的结构设计很讲究。 它包含：任务描述（这是什么样的任务）、执行步骤（标准的做法是什么）、关键判断点（在什么情况下要走不同的分支）、潜在陷阱（之前踩过的坑）、验证方式（怎么确认任务完成了）。这个结构保证了Skill的可复用性——你拿到一个新的任务，只要它跟某个Skill的“任务描述”匹配，你就能大概率复用这套经验。

更妙的是，Skill之间可以组合和继承。一个复杂的任务可能需要调用多个Skill，这些Skill可以像乐高积木一样拼接起来。而且，高层的Skill可以继承底层Skill的能力，形成一个技能树。

这意味着什么？你用得越久，Hermes Agent的“技能树”就越茂盛。最初它可能只会一些基础操作，但随着你让它完成各种任务，它会逐渐学会处理越来越复杂的场景，而且每次遇到类似场景都会更快更准。

4.3 自训练雏形：让“干活”本身成为“训练”

这个功能目前还是“雏形”阶段，但方向很清晰，意义也很重大。

Hermes Agent在运行过程中会记录每一次工具调用的轨迹：输入是什么，调用了什么工具，工具返回了什么，AI基于返回做了什么决策。这些轨迹数据是可以导出的。

导出来干什么？微调模型。

这是一个很巧妙的设计。你在用Hermes Agent帮你干活的过程中，其实也在为它生成训练数据。它帮你处理的任务越多，收集到的轨迹数据就越丰富，这些数据就可以用来微调底座的模型，让模型在特定场景下表现更好。

当然，现在这个功能还比较初级。我估计目前主要是用于研究目的，距离真正的“让模型自己通过完成任务来进化”还有距离。但这个方向一旦跑通，想象空间是巨大的——想象一下，一个AI助手，用得越久，它就越懂你的业务场景，模型就越能精准地处理你的专属问题。这跟现在的“通用大模型”完全是两个维度的事情。

4.4 三大支柱的协同：不是叠加，是化学反应

说了这么多独立的技术点，我想特别强调一下：这三个支柱不是三个独立的功能模块，它们是协同工作的，是一个整体的学习闭环。

用户提出任务 → Agent调用记忆检索是否有相关经验 → 如果有，参考Skill执行；如果没有，从头开始探索执行 → 任务完成后进入反思阶段，生成新的Skill或更新已有Skill → 执行过程中产生的轨迹数据可导出用于训练 → 所有这些学习成果都会被整理进记忆系统。

这个循环不是跑一次就结束了，而是持续运转的。每次用户使用，都是一次学习机会。记忆系统提供了“上下文检索”的能力，让Agent能快速找到相关的经验；Skill系统提供了“经验复用”的能力，让Agent不用每次都从零开始；自训练机制则提供了“模型进化”的可能性，让Agent的能力边界可以持续扩展。

这就是为什么我说它是一个“学习闭环”，而不是简单的功能堆砌。

5. 深度拆解：Hermes Agent vs OpenClaw，该用哪个？

说技术不谈对比就是耍流氓。这两个框架在社区里经常被放在一起聊，但大部分讨论流于表面。我来把它们的差异拆得更彻底一些。

5.1 两者的根本定位差异

你可以把这两个框架理解成两类人：OpenClaw 是那种"接单就干、效率极高的外包工程师"，Hermes Agent 是那种"越做越懂业务、越来越难以替代的内部员工"。它们的核心价值主张，从一开始就朝着两个不同的方向。

OpenClaw 的设计哲学是"极致的执行效率"。它做了大量工程优化，让 AI 能快速、可靠地调用各种工具、执行各种指令。它的工具链很丰富，支持代码执行、文件操作、网络请求等几乎所有你能想到的"动手"操作。核心价值在于：给它一个任务，它干得又快又好。

Hermes Agent 的设计哲学是"持续的能力积累"。它花了大量精力在记忆、学习、技能沉淀这些"软能力"上，相比之下工具链没有 OpenClaw 那么宽。核心价值在于：你用得越久，它越懂你，任务完成质量越高。

这个定位差异决定了它们在各个维度上的表现，我来逐一拆解。

5.2 六维对比：两张表格说清楚

表一：核心能力对比

维度	Hermes Agent	OpenClaw	说明
持久化记忆	★★★★★ 核心功能	★★☆☆☆ 基本缺失	Hermes 有完整三层记忆架构；OpenClaw 关闭窗口即失忆
自动技能积累	★★★★★ 独有	★☆☆☆☆ 无此机制	每完成任务自动抽象 Skill；OpenClaw 无学习闭环
工具调用广度	★★★☆☆ 中等	★★★★★ 非常丰富	OpenClaw 工具链更完善，代码执行/文件/网络全覆盖
任务执行速度	★★★☆☆ 中等	★★★★★ 极快	OpenClaw 为执行速度做了深度优化
长期使用价值	★★★★★ 越用越好	★★☆☆☆ 不随时间增长	Hermes 的核心优势：使用越久，积累越多
部署成本	★★★★★ 5美元VPS	★★★★☆ 同样低廉	两者都对个人开发者友好
自训练能力	★★★☆☆ 雏形阶段	★☆☆☆☆ 无	Hermes 可导出工具调用轨迹用于微调

表二：典型使用场景对比

场景	推荐选择	理由
一次性脚本执行、批量数据处理	OpenClaw	快速执行，没有长期积累需求
长期私人助手、个人知识管理	Hermes Agent	记住偏好与历史，越用越顺手
代码 Review、Debug、CI 自动化	OpenClaw	工具链完善，代码执行能力强
企业内部专属问答/客服机器人	Hermes Agent	持久记忆让机器人越来越了解用户
多步骤任务编排（写代码+部署+测试）	OpenClaw	任务编排和工具调用是其强项
研究型助手（需要跨会话积累洞见）	Hermes Agent	技能自动沉淀，避免重复踩坑
有既有 OpenClaw 工作流，想加记忆层	两者组合	hermes claw migrate 一键迁移，OpenClaw 干活 + Hermes 动脑

5.3 互补而非竞争：两者搭配的最佳姿势

Hermes 官方给出了一个很有意思的比喻：OpenClaw 是"龙虾的爪子"，专门负责抓取和执行；Hermes 是"龙虾的大脑"，负责记忆、判断和进化。两者合体，才是一只完整的龙虾。

实际上，hermes claw migrate 这条命令就是专门为这个场景设计的。如果你已经有一套跑在 OpenClaw 上的工作流，不需要从头迁移，直接运行这条命令就能把 Hermes 的记忆层和 Skill 系统叠加进来。OpenClaw 继续负责工具调用和执行，Hermes 在上面加一层"大脑"。

从架构上理解这种组合：执行层（OpenClaw）专注于"怎么做"，认知层（Hermes）专注于"做什么"和"从经验中学"。这种分工有点类似大脑的前额叶皮质和基底神经节的分工——前者负责高层规划，后者负责习惯化执行。

值得一提的是，这种开放的互操作设计在开源社区里不常见。很多框架都喜欢搞"护城河"，不愿意跟竞品打通。Hermes 和 OpenClaw 能互相支持迁移，说明两个团队对产品定位想得很清楚，也显示出一种少见的务实态度。

5.4 OpenClaw 的短板在哪里：一个真实案例

我见过一个很典型的场景：某个开发团队用 OpenClaw 搭了一套代码 Review 助手，运行了三个月。用起来顺手，但有个让人头疼的问题——每次 Review 的"规范"都得重新告诉它，团队的命名惯例、注释风格、测试要求，每次都要在 Prompt 里写一遍。不写，它就忘了。

这不是 OpenClaw 的 Bug，这是它的设计选择——它不做持久记忆。工程上看这样更简单、更可预测，但对于"需要理解团队上下文"的场景，就很不方便。

换成 Hermes Agent，这个问题就变成了：第一周你把团队规范告诉它，它记下来了；第二周你让它 Review 新代码，它会自动把这些规范调取出来，对照着审。三个月后，它不仅记住了明文规范，还从三个月的 Review 经历里学到了"这个团队哪类问题最容易出现"、"哪类修改方案被接受率最高"。这时候它的 Review 质量，跟刚配置完的时候相比，就完全不是一个量级的东西。

这就是为什么我觉得，对于需要"长期运营"的 AI 助手场景，Hermes Agent 和 OpenClaw 的差距，会随着时间的推移越来越大。

再跟其他框架比。 比如 LangChain、CrewAI、AutoGPT 这些。

LangChain是基础设施型的，它提供了大量的工具和抽象，但具体的“记忆怎么设计”“经验怎么积累”这些高级功能需要你自己实现。Hermes Agent则是一个更完整的“开箱即用”的方案，它把这些高级功能都做好了。

CrewAI是偏重多Agent协作的，擅长把不同角色的Agent组合起来处理复杂任务。Hermes Agent目前没有这么强的多Agent框架，但它的单Agent能力——尤其是记忆和学习方面——是更强的。

AutoGPT是“全自动”的代表，扔一个目标给它，它就自动拆解、自动执行、自动反思。它的野心很大，但在实际使用中经常会出现“跑偏”“死循环”的问题。Hermes Agent的设计更保守一些，它不强求“全自动”，而是强调“跟用户一起成长”。这种设计哲学的差异，决定了它的可靠性会更高一些。

总结一下： 如果你需要的是“强力的任务执行器”，OpenClaw可能是更好的选择。如果你需要的是“会学习、有记忆、能进化的长期助手”，Hermes Agent是市面上最成熟的方案。如果你的场景需要复杂的Multi-Agent编排，CrewAI可能更适合。但如果你想找一个“用得越久越好用”的AI伙伴，不用犹豫，Hermes Agent就是为你准备的。

6. 谁应该用它？什么场景下它是最优解？

好，说了这么多技术细节，你可能要问：这个东西到底适合谁用？

个人开发者和小团队。 这是我最推荐的人群。5美元VPS就能跑起来全部功能，这个门槛太低了。你不需要昂贵的GPU集群，不需要专业的运维团队，一台便宜的云服务器就能部署一个真正有记忆、会学习的AI助手。对于个人开发者来说，这意味着你终于有了一个“不会每次都问你同样的问题”的AI搭档。

需要长期维护客户/用户助手的场景。 比如客服机器人、售前咨询、售后支持这些场景。你希望机器人能记住用户的偏好、记住之前处理过的问题、越用越精准，而不是每次都从头开始。Hermes Agent的持久记忆系统非常适合这种场景。

企业内部知识管理的场景。 每个部门的员工有不同的工作方式、专业背景、信息需求。通用的大模型助手很难适应这种差异化，但有了Hermes Agent的记忆和学习能力，你可以慢慢把它“训练”成真正懂你们公司、懂你们业务的专业助手。

研究AI Agent进化的开发者。 如果你关心的是“如何让Agent真正学会”这个问题，Hermes Agent是一个很好的研究对象。它的Skill生成机制、记忆整理机制、自训练雏形，都是可以深入研究和二次开发的。

不太适合的场景： 如果你的需求是“快速执行一个一次性任务”，比如跑一个脚本、处理一批数据，Hermes Agent可能有点“杀鸡用牛刀”。它的优势在于长期价值，短期任务反而显得有点重。

7. 入门路径：从零到跑起来的实战指南

对于想上手的朋友，我来梳理一下学习路径。

第一步：体验官方演示。 Hermes Agent的GitHub首页有详细的介绍和演示视频，先看看它到底长什么样。

第二步：本地快速部署。 官方提供了多种部署方式，对于新手来说，最简单的是Docker部署。确保你的机器上装了Docker，然后按照文档跑几条命令，十几分钟就能起来一个能跑的基础版本。

第三步：配置你想要的模型。 Hermes Agent支持200+大模型，但默认可能用的是某个默认配置。你可以根据自己的需求和预算，选择接入哪个模型。官方推荐了一些性价比高的配置，也有针对高端用户的方案。建议新手先用默认配置跑通，再逐步优化。

第四步：体验核心功能。 起来之后，别急着让它干正事。先做几件小事体验一下它的记忆能力：问它一个问题，隔几天再问类似的问题，看它能不能关联到之前的对话。给它一个任务，完成后看它会不会生成Skill。试试检索功能，看它能不能从记忆里找到你埋下的“彩蛋”。

第五步：深入定制。 如果基础功能满足不了你，可以研究一下它的Skill系统、记忆配置、多平台接入等高级功能。官方文档写得挺细的，GitHub Issue区也有很多实战经验分享。

学习资源： 官方GitHub的README是必读的，里面的架构图和设计文档很有价值。Discord和GitHub Discussion是社区交流的主要场所，里面有很多用户的实战分享。 Nous Research的博客和Twitter也值得关注，团队会定期发布更新和背后思考。

8. 未来展望：这个方向的天花板在哪里

最后我们来聊聊这个项目的未来，以及它代表的方向有什么意义。

从项目本身来看， 我认为它的下一步重点会在几个方向：一是Skill系统的深化，让Skill之间能形成更复杂的组合和继承关系；二是自训练机制的成熟，从“雏形”变成真正可用的模型微调pipeline；三是多Agent协作能力的补强，跟OpenClaw等框架更好地打通。

从行业角度来看， Hermes Agent让我看到了一个很重要的趋势：AI Agent的竞争焦点正在从“工具调用能力”向“学习进化能力”转移。早期的框架都在比“谁能让模型调用更多工具”“谁的任务拆解更准确”，这些当然重要，但瓶颈也很明显——模型还是那个模型，框架做得再好也只是在调用它。

Hermes Agent代表的思路是：与其让模型调用更多工具，不如让模型学会更好地利用工具；与其让框架做更复杂的编排，不如让框架帮模型积累经验。这个思路更接近“真正的人工智能”应该有的样子。

从更宏观的角度看， Hermes Agent的持久记忆和自我进化机制，可能是通向AGI的一个小但重要的步骤。虽然现在的它还远远谈不上“通用智能”，但它展示了一种可能性：让AI不再是一个“每次都从零开始的工具”，而是能像人类一样“从经验中学习”的系统。这种能力的加入，可能会从根本上改变AI的应用范式。

当然，挑战也很多。记忆系统的真实性问题——AI“记住”的东西准不准，需不需要“遗忘”机制？Skill的质量问题——自动生成的Skill会不会有噪声，需不需要人工审核？隐私和安全问题——持久化的记忆如何保护，涉及敏感信息怎么办？这些都是需要持续探索的问题。

9. 结语：它代表了一种不同的可能性

写到这里，我想停下来问自己一个问题：为什么一个技术框架能两个月冲到60k Stars？

不是因为它用了什么最新的模型，不是因为它吹了什么宏大的概念，而是因为它解决了一个真实的、很多人都在经历的痛点——我们不想每次都跟一个“从零开始的陌生人”对话，我们想要一个“越来越懂我们的助手”。

Hermes Agent做到了。它不是最强大的任务执行器，不是最灵活的编排框架，但它可能是第一个真正让你感受到“AI在跟我一起成长”的产品。

两个月的60k Stars，是技术社区用脚投票的结果。这说明，“会学习的AI”不是伪需求，而是被大量用户真正需要的方向。

如果你也在寻找这样的AI伙伴，或者你对“能进化的Agent”这个方向感兴趣，我建议你亲自去试试这个项目。不需要很大的投入，一台便宜的VPS就够了。但你可能会收获的，是一个真正意义上“越用越懂你”的AI助手。

数据来源：HotGit（https://www.hotgit.org）