说实话,我第一次看到这个数据的时候是不信的。两个月,60k Stars,单日新增6400+,霸榜全球开源热榜第一。你要说这是某个大厂的重磅产品我信,但你告诉我这是一个名不见经传的研究团队从零开始做出来的?我第一反应是,数据刷的吧?
但当我真正深入去看这个项目,看它的设计理念、技术实现,看他们团队在Issue区和讨论区跟用户的互动方式,我服了。这不是运气,这是真东西。
这个项目叫 Hermes Agent,来自 Nous Research。核心卖点就一句话——“会自我成长的AI”。不是那种PPT上画饼的“自我进化”,是真正内置学习闭环的:它能从你交给它的任务里自动提炼出可复用的技能,能记住你的偏好和习惯,能跨会话精准回忆之前讨论过的内容,甚至还能把自己运行中产生的工具调用轨迹导出来微调模型。
这意味着什么?意味着你用得越久,它就越懂你。意味着一个真正意义上“越来越好用”的AI助手,不是靠你手动喂数据,而是它自己学会的。
今天我们就来好好扒一扒这个项目,看看它到底是怎么做到的,以及为什么我认为它代表了AI Agent框架的一个新方向。
1. 从“工具调用”到“真正的助手”:一个困扰行业很久的问题
在说Hermes Agent之前,我想先聊聊为什么它让我眼前一亮。
过去两年,AI Agent的概念火得一塌糊涂。从LangChain到AutoGPT,从CrewAI到各种国产框架,你能看到无数“智能助手”被造出来。但说实话,用过之后你会发现一个很尴尬的事实:它们都不够“智能”。
不是模型不够强——GPT-4、Claude 3.5的能力摆在那里。问题在于,这些Agent框架本质上还是“更高级的工具调用器”。你让它做一件事,它就做一件事。做完了,结束。下次遇到类似的场景,它不会因为上次做过了就更快更好。它没有记忆,没有经验,没有“学会”。
更让人头疼的是偏好问题。我见过太多团队在企业内部部署AI助手,每个员工的习惯、工作方式、专业领域都不一样。理论上AI应该适应人,但实际上,每次对话都是从零开始。你想让AI记住“你是XX部门的,偏好用XX方式输出结果”?做梦。关掉对话窗口,一切归零。
这就引出了一个根本性的问题:AI Agent框架的核心价值,到底应该是“让模型调用更多工具”,还是“让模型真正学会理解任务、积累经验、持续进化”?
大多数框架选择了前者。Hermes Agent选择了后者。
2. Hermes Agent全景:它到底是什么,能解决什么问题
先给不了解的朋友做个简单介绍。Hermes Agent是Nous Research团队开发的一个AI Agent框架,2026年2月底开源,到现在也就几个月时间。但就是这几个月,它从GitHub的角落里一路杀到了全榜第一。
它的定位很有意思——不是要做“更强力的任务执行器”,而是要做“有记忆、会学习、能进化”的AI伙伴。官方自己的描述是"The agent that grows with you",翻译过来就是“和你一起成长的Agent”。
那它具体是怎么做到的呢?我总结了一下,它有三大核心能力:
第一,持久化记忆系统。 这是它跟其他框架最大的区别。大多数Agent框架的“记忆”其实就是对话历史(Context),撑不过一个会话窗口。Hermes Agent不一样,它有真正的持久化存储——会把用户信息、任务上下文、关键决策都存下来,而且支持全文检索。更厉害的是,它还能用模型自动对记忆做摘要压缩,防止信息爆炸,同时建立跨任务的关联,让“经验”真正能被复用。
第二,技能自动生成与复用。 这是它自我进化的核心机制。当你让Hermes Agent完成一个任务后,它不会就此结束。它会分析这次任务的执行过程,把其中有价值的步骤、判断逻辑、潜在坑点抽象出来,生成一个结构化的Skill。这个Skill不是给人类看的说明文档,而是它自己下次遇到类似任务时能直接调用的“经验”。你用得越多,它会的越多。
第三,自训练雏形。 这个更激进。它在运行过程中会记录工具调用的轨迹数据,这些数据是可以导出来用于模型微调的。什么意思?就是你在用它完成任务的过程中,其实也在为它生成训练数据。它越帮你干活,它就越“聪明”。虽然现在还只是雏形阶段,但这个方向想象空间太大了。
除了这三大核心能力,它还有几个很实在的亮点:
部署方式极其灵活,支持200+大模型一键切换,本地/Docker/SSH/Daytona/Singularity/Modal六种部署方式。官方甚至说,5美元的VPS就能跑起来全部功能。这对于个人开发者和中小企业来说太友好了。
多平台接入,主流的Telegram、Discord、Slack、WhatsApp、Signal都能连。这意味着你可以把它部署成真正的“私人助手”,随时通过你习惯的IM工具调用。
有意思的是它和OpenClaw(就是那个被大家叫“龙虾”的框架)的互补定位。用官方的话说,OpenClaw负责“干活”,Hermes负责“动脑”。如果你已经在用OpenClaw,可以一键迁移(hermes claw migrate)。这种开放的态度在开源社区里挺难得的。
3. 诞生背景:不是凭空出现的,它有清晰的技术脉络
Hermes Agent不是凭空冒出来的,它的背后是Nous Research这个团队在LLM Agent方向上的长期积累。
Nous Research可能有些人不熟悉,这是一家专注于大语言模型研究的机构,创始团队成员有在Anthropic、OpenAI等公司工作的背景。他们之前就开源过不少项目,在AI圈子里有一定口碑。Hermes系列是他们的大语言模型产品线,之前的Hermes 2、 Hermes 3在开源社区都反响不错。Hermes Agent是把Hermes模型能力产品化、做成一整套Agent框架的尝试。
从技术演进的角度看,Hermes Agent解决的是一个很实际的问题:单纯的模型能力已经遇到了瓶颈,业界开始意识到,决定Agent实际表现的关键不只是模型本身,还有框架层面的设计——如何让模型更好地利用工具,如何让模型真正理解任务目标,如何让模型积累经验而不是每次都从零开始。
在这样的背景下,Hermes Agent的定位就很清晰了:它不是又一个“功能堆砌型”框架,而是试图在Agent架构层面做出创新,真正解决记忆、学习、进化的问题。
从时间线来看,2026年2月底开源v0.1.0,3月初快速迭代到v0.5.0、v0.6.0,3月中旬发布v0.8.0引爆全网,然后持续快速迭代到现在。社区反馈极其热烈,Issue区和讨论区都很活跃,团队响应速度也很快。这种节奏说明项目不是在“放出去就不管了”,而是真的在认真做产品。
4. 技术深潜:三大支柱的内在逻辑
好,前面说的都是“是什么”和“为什么”,接下来我们来好好扒一扒“怎么做”。这部分会比较硬核,但我会尽量用类比和故事讲清楚。
4.1 持久化记忆系统:不只是存储,是一套认知架构
大多数框架的“记忆”就是个简单的KV存储,或者干脆用向量数据库做个语义检索。Hermes Agent不一样,它的记忆系统是一套有内在逻辑的架构。
首先,它把记忆分成了几层:即时记忆、短期记忆、长期记忆。即时记忆就是当前对话的上下文,这个好理解。短期记忆是跨会话但还在“热乎期”的信息,比如你上周让AI做的那个项目的一些细节。长期记忆则是经过提炼和整合的、稳定的知识,比如你的工作习惯、专业背景、偏好设置。
这个分层的意义在于:AI不需要每次都把所有的“历史对话”都塞进Context窗口,那样既浪费Token,效果也不好。AI可以根据当前任务的需要,动态地从记忆系统里检索相关信息,然后以“更高效的形式”呈现在上下文里。
检索机制是关键技术。 Hermes Agent用了全文检索+语义检索的组合。全文检索保证你能搜到精确匹配的关键词,语义检索则能理解你的查询意图。比如你说“上次那个关于xxx的项目”,它能自动关联到相关的记忆,而不是傻傻地告诉你“对不起,我没有找到包含’xxx’的对话记录”。
更厉害的是自动摘要和关联建立。记忆系统会定期运行一个“整理”过程,用模型来分析新存入的记忆,跟已有的记忆做对比,把冗余的信息合并,把相关的记忆关联起来。这就像你大脑里的“海马体”巩固记忆的过程——不是简单地把信息堆在那里,而是真正把它整合进你的知识体系里。
我见过一些框架也在做“记忆”,但大多数只是做了存储层,没有做这个“认知加工”的过程。没有这个过程,记忆就只是“日志”,不是“经验”。
4.2 技能自动生成:从“做任务”到“会方法论”
这是Hermes Agent最让我兴奋的部分,也是它“自我进化”能力的核心体现。
当AI完成一个任务后,它会进入一个“反思和学习”的阶段。不是你让它学,是它自己分析刚才的过程。
具体来说,它会拆解这个任务的执行流程:分几步走的,每一步的关键决策是什么,有没有什么坑点需要注意,怎么验证任务是否真的完成了。这些信息会被结构化地组织起来,形成一个叫做"Skill"的产物。
这个Skill不是给人类写的文档,而是AI自己可以理解和调用的“经验模块”。下次遇到类似任务,它不会傻乎乎地从第一步开始摸索,而是会直接调用这个Skill,参考之前的判断逻辑,甚至能复用之前的工具调用序列。
Skill的结构设计很讲究。 它包含:任务描述(这是什么样的任务)、执行步骤(标准的做法是什么)、关键判断点(在什么情况下要走不同的分支)、潜在陷阱(之前踩过的坑)、验证方式(怎么确认任务完成了)。这个结构保证了Skill的可复用性——你拿到一个新的任务,只要它跟某个Skill的“任务描述”匹配,你就能大概率复用这套经验。
更妙的是,Skill之间可以组合和继承。一个复杂的任务可能需要调用多个Skill,这些Skill可以像乐高积木一样拼接起来。而且,高层的Skill可以继承底层Skill的能力,形成一个技能树。
这意味着什么?你用得越久,Hermes Agent的“技能树”就越茂盛。最初它可能只会一些基础操作,但随着你让它完成各种任务,它会逐渐学会处理越来越复杂的场景,而且每次遇到类似场景都会更快更准。
4.3 自训练雏形:让“干活”本身成为“训练”
这个功能目前还是“雏形”阶段,但方向很清晰,意义也很重大。
Hermes Agent在运行过程中会记录每一次工具调用的轨迹:输入是什么,调用了什么工具,工具返回了什么,AI基于返回做了什么决策。这些轨迹数据是可以导出的。
导出来干什么?微调模型。
这是一个很巧妙的设计。你在用Hermes Agent帮你干活的过程中,其实也在为它生成训练数据。它帮你处理的任务越多,收集到的轨迹数据就越丰富,这些数据就可以用来微调底座的模型,让模型在特定场景下表现更好。
当然,现在这个功能还比较初级。我估计目前主要是用于研究目的,距离真正的“让模型自己通过完成任务来进化”还有距离。但这个方向一旦跑通,想象空间是巨大的——想象一下,一个AI助手,用得越久,它就越懂你的业务场景,模型就越能精准地处理你的专属问题。这跟现在的“通用大模型”完全是两个维度的事情。
4.4 三大支柱的协同:不是叠加,是化学反应
说了这么多独立的技术点,我想特别强调一下:这三个支柱不是三个独立的功能模块,它们是协同工作的,是一个整体的学习闭环。
用户提出任务 → Agent调用记忆检索是否有相关经验 → 如果有,参考Skill执行;如果没有,从头开始探索执行 → 任务完成后进入反思阶段,生成新的Skill或更新已有Skill → 执行过程中产生的轨迹数据可导出用于训练 → 所有这些学习成果都会被整理进记忆系统。
这个循环不是跑一次就结束了,而是持续运转的。每次用户使用,都是一次学习机会。记忆系统提供了“上下文检索”的能力,让Agent能快速找到相关的经验;Skill系统提供了“经验复用”的能力,让Agent不用每次都从零开始;自训练机制则提供了“模型进化”的可能性,让Agent的能力边界可以持续扩展。
这就是为什么我说它是一个“学习闭环”,而不是简单的功能堆砌。
5. 深度拆解:Hermes Agent vs OpenClaw,该用哪个?
说技术不谈对比就是耍流氓。这两个框架在社区里经常被放在一起聊,但大部分讨论流于表面。我来把它们的差异拆得更彻底一些。
5.1 两者的根本定位差异
你可以把这两个框架理解成两类人:OpenClaw 是那种"接单就干、效率极高的外包工程师",Hermes Agent 是那种"越做越懂业务、越来越难以替代的内部员工"。它们的核心价值主张,从一开始就朝着两个不同的方向。
OpenClaw 的设计哲学是"极致的执行效率"。它做了大量工程优化,让 AI 能快速、可靠地调用各种工具、执行各种指令。它的工具链很丰富,支持代码执行、文件操作、网络请求等几乎所有你能想到的"动手"操作。核心价值在于:给它一个任务,它干得又快又好。
Hermes Agent 的设计哲学是"持续的能力积累"。它花了大量精力在记忆、学习、技能沉淀这些"软能力"上,相比之下工具链没有 OpenClaw 那么宽。核心价值在于:你用得越久,它越懂你,任务完成质量越高。
这个定位差异决定了它们在各个维度上的表现,我来逐一拆解。
5.2 六维对比:两张表格说清楚
表一:核心能力对比
| 维度 | Hermes Agent | OpenClaw | 说明 |
|---|---|---|---|
| 持久化记忆 | ★★★★★ 核心功能 | ★★☆☆☆ 基本缺失 | Hermes 有完整三层记忆架构;OpenClaw 关闭窗口即失忆 |
| 自动技能积累 | ★★★★★ 独有 | ★☆☆☆☆ 无此机制 | 每完成任务自动抽象 Skill;OpenClaw 无学习闭环 |
| 工具调用广度 | ★★★☆☆ 中等 | ★★★★★ 非常丰富 | OpenClaw 工具链更完善,代码执行/文件/网络全覆盖 |
| 任务执行速度 | ★★★☆☆ 中等 | ★★★★★ 极快 | OpenClaw 为执行速度做了深度优化 |
| 长期使用价值 | ★★★★★ 越用越好 | ★★☆☆☆ 不随时间增长 | Hermes 的核心优势:使用越久,积累越多 |
| 部署成本 | ★★★★★ 5美元VPS | ★★★★☆ 同样低廉 | 两者都对个人开发者友好 |
| 自训练能力 | ★★★☆☆ 雏形阶段 | ★☆☆☆☆ 无 | Hermes 可导出工具调用轨迹用于微调 |
表二:典型使用场景对比
| 场景 | 推荐选择 | 理由 |
|---|---|---|
| 一次性脚本执行、批量数据处理 | OpenClaw | 快速执行,没有长期积累需求 |
| 长期私人助手、个人知识管理 | Hermes Agent | 记住偏好与历史,越用越顺手 |
| 代码 Review、Debug、CI 自动化 | OpenClaw | 工具链完善,代码执行能力强 |
| 企业内部专属问答/客服机器人 | Hermes Agent | 持久记忆让机器人越来越了解用户 |
| 多步骤任务编排(写代码+部署+测试) | OpenClaw | 任务编排和工具调用是其强项 |
| 研究型助手(需要跨会话积累洞见) | Hermes Agent | 技能自动沉淀,避免重复踩坑 |
| 有既有 OpenClaw 工作流,想加记忆层 | 两者组合 | hermes claw migrate 一键迁移,OpenClaw 干活 + Hermes 动脑 |
5.3 互补而非竞争:两者搭配的最佳姿势
Hermes 官方给出了一个很有意思的比喻:OpenClaw 是"龙虾的爪子",专门负责抓取和执行;Hermes 是"龙虾的大脑",负责记忆、判断和进化。两者合体,才是一只完整的龙虾。
实际上,hermes claw migrate 这条命令就是专门为这个场景设计的。如果你已经有一套跑在 OpenClaw 上的工作流,不需要从头迁移,直接运行这条命令就能把 Hermes 的记忆层和 Skill 系统叠加进来。OpenClaw 继续负责工具调用和执行,Hermes 在上面加一层"大脑"。
从架构上理解这种组合:执行层(OpenClaw)专注于"怎么做",认知层(Hermes)专注于"做什么"和"从经验中学"。这种分工有点类似大脑的前额叶皮质和基底神经节的分工——前者负责高层规划,后者负责习惯化执行。
值得一提的是,这种开放的互操作设计在开源社区里不常见。很多框架都喜欢搞"护城河",不愿意跟竞品打通。Hermes 和 OpenClaw 能互相支持迁移,说明两个团队对产品定位想得很清楚,也显示出一种少见的务实态度。
5.4 OpenClaw 的短板在哪里:一个真实案例
我见过一个很典型的场景:某个开发团队用 OpenClaw 搭了一套代码 Review 助手,运行了三个月。用起来顺手,但有个让人头疼的问题——每次 Review 的"规范"都得重新告诉它,团队的命名惯例、注释风格、测试要求,每次都要在 Prompt 里写一遍。不写,它就忘了。
这不是 OpenClaw 的 Bug,这是它的设计选择——它不做持久记忆。工程上看这样更简单、更可预测,但对于"需要理解团队上下文"的场景,就很不方便。
换成 Hermes Agent,这个问题就变成了:第一周你把团队规范告诉它,它记下来了;第二周你让它 Review 新代码,它会自动把这些规范调取出来,对照着审。三个月后,它不仅记住了明文规范,还从三个月的 Review 经历里学到了"这个团队哪类问题最容易出现"、"哪类修改方案被接受率最高"。这时候它的 Review 质量,跟刚配置完的时候相比,就完全不是一个量级的东西。
这就是为什么我觉得,对于需要"长期运营"的 AI 助手场景,Hermes Agent 和 OpenClaw 的差距,会随着时间的推移越来越大。
再跟其他框架比。 比如 LangChain、CrewAI、AutoGPT 这些。
LangChain是基础设施型的,它提供了大量的工具和抽象,但具体的“记忆怎么设计”“经验怎么积累”这些高级功能需要你自己实现。Hermes Agent则是一个更完整的“开箱即用”的方案,它把这些高级功能都做好了。
CrewAI是偏重多Agent协作的,擅长把不同角色的Agent组合起来处理复杂任务。Hermes Agent目前没有这么强的多Agent框架,但它的单Agent能力——尤其是记忆和学习方面——是更强的。
AutoGPT是“全自动”的代表,扔一个目标给它,它就自动拆解、自动执行、自动反思。它的野心很大,但在实际使用中经常会出现“跑偏”“死循环”的问题。Hermes Agent的设计更保守一些,它不强求“全自动”,而是强调“跟用户一起成长”。这种设计哲学的差异,决定了它的可靠性会更高一些。
总结一下: 如果你需要的是“强力的任务执行器”,OpenClaw可能是更好的选择。如果你需要的是“会学习、有记忆、能进化的长期助手”,Hermes Agent是市面上最成熟的方案。如果你的场景需要复杂的Multi-Agent编排,CrewAI可能更适合。但如果你想找一个“用得越久越好用”的AI伙伴,不用犹豫,Hermes Agent就是为你准备的。
6. 谁应该用它?什么场景下它是最优解?
好,说了这么多技术细节,你可能要问:这个东西到底适合谁用?
个人开发者和小团队。 这是我最推荐的人群。5美元VPS就能跑起来全部功能,这个门槛太低了。你不需要昂贵的GPU集群,不需要专业的运维团队,一台便宜的云服务器就能部署一个真正有记忆、会学习的AI助手。对于个人开发者来说,这意味着你终于有了一个“不会每次都问你同样的问题”的AI搭档。
需要长期维护客户/用户助手的场景。 比如客服机器人、售前咨询、售后支持这些场景。你希望机器人能记住用户的偏好、记住之前处理过的问题、越用越精准,而不是每次都从头开始。Hermes Agent的持久记忆系统非常适合这种场景。
企业内部知识管理的场景。 每个部门的员工有不同的工作方式、专业背景、信息需求。通用的大模型助手很难适应这种差异化,但有了Hermes Agent的记忆和学习能力,你可以慢慢把它“训练”成真正懂你们公司、懂你们业务的专业助手。
研究AI Agent进化的开发者。 如果你关心的是“如何让Agent真正学会”这个问题,Hermes Agent是一个很好的研究对象。它的Skill生成机制、记忆整理机制、自训练雏形,都是可以深入研究和二次开发的。
不太适合的场景: 如果你的需求是“快速执行一个一次性任务”,比如跑一个脚本、处理一批数据,Hermes Agent可能有点“杀鸡用牛刀”。它的优势在于长期价值,短期任务反而显得有点重。
7. 入门路径:从零到跑起来的实战指南
对于想上手的朋友,我来梳理一下学习路径。
第一步:体验官方演示。 Hermes Agent的GitHub首页有详细的介绍和演示视频,先看看它到底长什么样。
第二步:本地快速部署。 官方提供了多种部署方式,对于新手来说,最简单的是Docker部署。确保你的机器上装了Docker,然后按照文档跑几条命令,十几分钟就能起来一个能跑的基础版本。
第三步:配置你想要的模型。 Hermes Agent支持200+大模型,但默认可能用的是某个默认配置。你可以根据自己的需求和预算,选择接入哪个模型。官方推荐了一些性价比高的配置,也有针对高端用户的方案。建议新手先用默认配置跑通,再逐步优化。
第四步:体验核心功能。 起来之后,别急着让它干正事。先做几件小事体验一下它的记忆能力:问它一个问题,隔几天再问类似的问题,看它能不能关联到之前的对话。给它一个任务,完成后看它会不会生成Skill。试试检索功能,看它能不能从记忆里找到你埋下的“彩蛋”。
第五步:深入定制。 如果基础功能满足不了你,可以研究一下它的Skill系统、记忆配置、多平台接入等高级功能。官方文档写得挺细的,GitHub Issue区也有很多实战经验分享。
学习资源: 官方GitHub的README是必读的,里面的架构图和设计文档很有价值。Discord和GitHub Discussion是社区交流的主要场所,里面有很多用户的实战分享。 Nous Research的博客和Twitter也值得关注,团队会定期发布更新和背后思考。
8. 未来展望:这个方向的天花板在哪里
最后我们来聊聊这个项目的未来,以及它代表的方向有什么意义。
从项目本身来看, 我认为它的下一步重点会在几个方向:一是Skill系统的深化,让Skill之间能形成更复杂的组合和继承关系;二是自训练机制的成熟,从“雏形”变成真正可用的模型微调pipeline;三是多Agent协作能力的补强,跟OpenClaw等框架更好地打通。
从行业角度来看, Hermes Agent让我看到了一个很重要的趋势:AI Agent的竞争焦点正在从“工具调用能力”向“学习进化能力”转移。早期的框架都在比“谁能让模型调用更多工具”“谁的任务拆解更准确”,这些当然重要,但瓶颈也很明显——模型还是那个模型,框架做得再好也只是在调用它。
Hermes Agent代表的思路是:与其让模型调用更多工具,不如让模型学会更好地利用工具;与其让框架做更复杂的编排,不如让框架帮模型积累经验。这个思路更接近“真正的人工智能”应该有的样子。
从更宏观的角度看, Hermes Agent的持久记忆和自我进化机制,可能是通向AGI的一个小但重要的步骤。虽然现在的它还远远谈不上“通用智能”,但它展示了一种可能性:让AI不再是一个“每次都从零开始的工具”,而是能像人类一样“从经验中学习”的系统。这种能力的加入,可能会从根本上改变AI的应用范式。
当然,挑战也很多。记忆系统的真实性问题——AI“记住”的东西准不准,需不需要“遗忘”机制?Skill的质量问题——自动生成的Skill会不会有噪声,需不需要人工审核?隐私和安全问题——持久化的记忆如何保护,涉及敏感信息怎么办?这些都是需要持续探索的问题。
9. 结语:它代表了一种不同的可能性
写到这里,我想停下来问自己一个问题:为什么一个技术框架能两个月冲到60k Stars?
不是因为它用了什么最新的模型,不是因为它吹了什么宏大的概念,而是因为它解决了一个真实的、很多人都在经历的痛点——我们不想每次都跟一个“从零开始的陌生人”对话,我们想要一个“越来越懂我们的助手”。
Hermes Agent做到了。它不是最强大的任务执行器,不是最灵活的编排框架,但它可能是第一个真正让你感受到“AI在跟我一起成长”的产品。
两个月的60k Stars,是技术社区用脚投票的结果。这说明,“会学习的AI”不是伪需求,而是被大量用户真正需要的方向。
如果你也在寻找这样的AI伙伴,或者你对“能进化的Agent”这个方向感兴趣,我建议你亲自去试试这个项目。不需要很大的投入,一台便宜的VPS就够了。但你可能会收获的,是一个真正意义上“越用越懂你”的AI助手。
数据来源:HotGit(https://www.hotgit.org)
夜雨聆风