最近我的信息流被一个东西刷屏了。
不是又一个套壳ChatGPT的产品,不是又一个「AI赋能XX行业」的PPT,而是一个真正让我停下来想了很久的开源项目。
Hermes Agent。
GitHub上两个月飙到27K Stars,Hacker News反复上首页,国内外技术圈几乎同步炸锅。我身边搞AI的朋友,十个里面七八个都在聊它。
说真的,Agent这个词我都快听吐了。从去年到今年,每隔三天就有人喊「AI Agent时代来了」,然后丢出来的东西嘛。。。坦率的讲,大部分都是拿LangChain串几个API调用,包一层花哨的UI,就敢叫自己Agent。
但Hermes确实不太一样。
我花了一周时间实际跑了一下,越用越觉得,这玩意的设计哲学跟之前所有的Agent框架都不在一个维度上。今天就来认真聊聊,它到底是个什么东西,为什么突然这么火,以及跟我们熟悉的Claude Code、OpenClaw比起来,它的路子到底有什么不同。
顺着这个话题往下聊之前,我想先说一个最近让我特别有感触的体验。
我用Claude Code写代码已经大半年了,体验确实好,响应快,代码质量高,debug能力强。但有一个事儿一直让我觉得别扭,每次开新对话,它就跟失忆了一样。上一轮我刚跟它说完「我这个项目用的是pnpm workspace + Turborepo的monorepo结构」,下一轮它又开心地给我写npm install。
你跟它之间没有「积累」。
每次对话都是一张白纸,你得重新解释一遍项目背景、技术栈偏好、代码规范。它是一个非常厉害的工具,但它不认识你。
这个痛点,可能就是理解Hermes Agent为什么火的关键入口。
Hermes Agent是Nous Research在今年2月开源的一个AI Agent框架。Nous Research这个名字你可能没那么熟,但如果你关注开源模型圈,他们其实是老玩家了,Hermes系列微调模型、Psyche分布式训练框架,都是他们的作品。这次做Agent框架,算是从模型训练走到了应用层。
它的官方定位只有一句话,「The agent that grows with you」。
一个会随着你使用而成长的Agent。
听着像营销话术对吧?我一开始也是这么想的。但用了之后我发现,他们是认真的。
Hermes跟其他Agent最核心的区别在于三个东西,记忆、技能、和一个叫「学习循环」的机制。这三个东西串在一起,形成了一个闭环,让Agent真的能越用越强。
先说记忆。
我们平时用的ChatGPT、Claude这些,说到底都是「无状态」的。你每次开一个新对话,对它来说世界就重新开始了。有些产品加了Memory功能,比如ChatGPT的记忆,但那个更像是在对话框旁边贴了几张便利贴,模型能看到,但不会真正基于这些信息调整自己的行为模式。
Hermes的记忆系统完全不是这个思路。
它设计了三层记忆结构。短期记忆就是当前对话的上下文,这个大家都有。中期记忆是跨会话的任务经验,比如你上周让它帮你搞了一次Kubernetes部署,这次再遇到类似的事它还记得上次踩过什么坑。长期记忆是持久化的知识积累,你的技术栈偏好、项目结构、甚至你习惯用Tab还是空格缩进,它都会记住。
更有意思的是,它的记忆不是无限堆砌的。当记忆接近上限(大概1300 tokens)的时候,它会自动做一件事,压缩。合并相似的条目、删除过时的信息、把多条记录浓缩成更精炼的表述。
这个设计太聪明了。
想想看,人的记忆也是这样工作的。你不会记住过去一年每一顿饭吃了什么,但你会记住「我对海鲜过敏」这个关键信息。Hermes的记忆压缩机制,跟人整理笔记的逻辑几乎一模一样,少量精准的信息,远比大量模糊的信息有用。
记忆解决了「它认识你」的问题。但光认识你还不够,它还得「变强」。
这就是Hermes第二个核心能力,自动技能创建。
我举个例子。假设你第一次让Hermes帮你配置一个Next.js项目的CI/CD流水线,它可能需要调用十几次工具,查文档、写配置、跑测试、修bug,来来回回折腾半天。
但完成之后,Hermes会做一件其他Agent都不做的事。
它会把刚才的整个解决过程,自动写成一份叫SKILL.md的技能文档。这份文档里有完整的步骤、踩过的坑、验证方法,甚至还有「下次遇到这个问题应该先检查什么」的经验总结。然后这个技能就被存进了它的本地技能库。
下次你再让它配CI/CD的时候,它会先去技能库里搜一圈,发现「嘿,我之前干过这事」,然后直接调用已有的技能来执行。
有人做过实测,一个月后,同类任务的工具调用次数从25次压缩到了8-10次。模型没换,Agent自己变快了。
还有一个特别有意思的设计,它每15次工具调用会自动暂停一下,做一次自检。反思刚才哪些步骤做对了、哪些做错了,然后更新记忆。你想想看,这不就是我们写代码的时候定期review一下自己的做法吗?只不过这个Agent把它自动化了。
这就是那个「学习循环」在起作用。
用一张图来说的话,大概是这个流程,你给它一个任务→它用现有知识解决→解决成功后自动写成技能→技能入库→下次遇到类似问题直接调用→循环往复。同时记忆系统一直在旁边默默积累你的偏好和项目上下文。
两个系统叠加在一起,就是「越用越聪明」的底层逻辑。
说到这,可能有人会问,这跟OpenClaw的技能系统有什么区别?
好问题。区别还真挺大的。
OpenClaw的技能生态非常庞大,ClawHub上面有13000多个社区贡献的技能,标准化封装,拿来就用。你想配Kubernetes?去ClawHub搜一下,下载一个社区技能,装上就能跑。就像教科书,内容丰富,质量有保障。
Hermes的技能不是这么来的。它的技能是Agent从你的实际使用过程中自己创建的。它知道你的项目用的是什么技术栈、你的服务器环境长什么样、你的代码规范是什么。这些技能是完全贴合你的私人笔记,不是通用教材。
打个比方,OpenClaw给你的是一本五星好评的《Kubernetes权威指南》,而Hermes给你的是你自己在实战中写的运维手册。哪个更好用?看场景。但如果是你自己天天要操作的那套环境,大概率是后者。
当然Hermes也不是封闭的。它兼容agentskills.io的开放标准,你也可以从社区安装别人分享的技能。只是它的核心设计理念是「从实践中长出来」,而不是「从商店里下载」。
聊完了核心机制,再说说另一个让我觉得Hermes很有想法的地方,它的运行形态。
大部分AI Agent,不管是Claude Code还是OpenClaw,你得主动去找它。打开IDE,或者打开某个网页,然后跟它对话。用完了,关掉,它就停了。
Hermes不是这样。
它被设计成一个「住在你服务器上」的常驻进程。你可以用systemd把它跑成后台服务,7×24小时运行。它有内置的cron调度器,你可以让它每天早上9点自动去Hacker News上扫一遍AI新闻,然后通过Telegram给你发个摘要。你可以让它每周五自动跑一遍项目的依赖安全检查,有问题就在Slack上通知你。
说到Telegram和Slack,这就涉及到Hermes另一个比较独特的能力了,多平台消息网关。
大部分Agent只有CLI或者Web UI。但Hermes可以同时接入Telegram、Discord、Slack、WhatsApp、钉钉、飞书、企业微信。。。总共15+个平台。你在Telegram上跟它说了一半的事,切到终端继续聊,上下文自动衔接。
这个设计让它不再是一个「打开→使用→关闭」的工具,而更接近一个随时在线的团队成员。
我自己其实一直有一个想法,想搭一个24/7在线的个人助手Agent,能覆盖生活和工作的各种场景。之前用LangGraph搭过一些原型,但消息通道这块一直没搞好。Hermes的网关设计,坦率的讲,比我自己造轮子靠谱多了。
说了这么多好的,也该说说它的局限了。
Hermes的问题是,它还是一个相当早期的项目。2月份才发布,现在v0.7.0,很多功能还在快速迭代中。文档虽然有但不算完善,很多进阶用法得去翻GitHub Issues和Discord讨论。
而且它对使用者的技术门槛要求比Claude Code高不少。Claude Code你装个VS Code插件就能用,Hermes你得自己搞一台服务器(或者VPS),跑安装脚本,配置模型提供商,调网关。虽然官方说$5/月的VPS就能跑,但从「能跑」到「好用」之间还有不少调教工作。
另一个需要注意的点是,自动技能创建听起来很美好,但它的质量高度依赖底层模型的能力。如果你接的是一个推理能力一般的模型,自动生成的技能可能不靠谱,甚至会「学错」。这时候越用越聪明就变成了越用越离谱。
反过来看看Claude Code和OpenClaw各自的优势,也是挺明显的。
Claude Code在纯编码场景的能力,目前还是天花板级别的。代码生成质量、bug定位速度、对复杂代码库的理解深度,Hermes还追不上。如果你的需求就是「写代码」,Claude Code仍然是最好的选择。
OpenClaw的生态规模和多渠道运营能力也不是Hermes能比的。247K Stars、22+平台接入、13000+社区技能,这个体量摆在那里。如果你是一个团队需要搭建一套完整的Agent运营体系,OpenClaw的成熟度高出不止一个量级。
所以其实这三个产品,与其说是竞争关系,不如说是三个不同定位的东西。
Claude Code是你的编码副驾驶,坐在IDE里帮你写代码。OpenClaw是你的多渠道Agent运营平台,帮你管理复杂的自动化流程。而Hermes Agent,是一个住在服务器上、会自我学习的个人助理,越用越懂你。
它们完全可以同时存在。
回到最开始的问题,Hermes Agent为什么火?
我觉得根本原因是,它第一次让「AI Agent会成长」这件事变得可感知了。
之前大家喊Agent喊了一两年,但大部分产品给人的感觉都是「一个会调用工具的聊天机器人」。你给它一个任务,它执行完了,下次还是一样。它不会记住你,不会从经验中学习,不会自己变强。
Hermes把记忆、技能、学习循环三个东西合在一起,第一次让用户真实地感受到了,这个Agent确实在「长大」。上个月它还需要25步才能完成的事,这个月只要10步了。它记得你喜欢用pnpm不用npm,记得你的Nginx配置习惯放在/etc/nginx/conf.d/下面,记得上次那个Docker网络问题的解决方案。
这种「被记住」和「被理解」的感觉,是之前所有AI产品都没给过的。
还记得我开头说的那个Claude Code反复失忆的事吗?Hermes不会这样。你跟它说过一次的事,它真的记住了。这听起来好像没什么,但当你习惯了每次都要从头解释的时候,突然有一个AI说「我知道,你上次说过了」,那种感觉。。。怎么说呢,挺暖的。
而且它是MIT协议完全开源的。所有数据存在你本地,零遥测,零追踪。在这个隐私越来越被重视的时代,一个完全透明、完全自托管的方案,天然就有吸引力。
再加上Nous Research作为一个正经做模型训练的研究机构,品牌背书也够硬。不是某个创业团队三个月攒出来的demo,而是一群真正懂模型训练的人做出来的Agent框架。它甚至内置了生成训练数据和跑强化学习实验的能力,这种「科研级基因」在Agent产品里几乎是独一份。
如果你想上手试试,安装其实不难。
一条命令就行。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash装完之后跑 hermes setup 走一遍配置向导,选一个模型提供商(推荐先用OpenRouter,一个API Key就能切换200多个模型),然后 hermes 就进入交互模式了。
如果你想接Telegram或者微信,再跑一下 hermes gateway setup,跟着提示走就行。
我自己目前的用法是把它部署在一台$5/月的VPS上,接了Telegram作为主要交互渠道。每天早上它会自动给我推一份AI新闻摘要,平时有什么临时的技术问题也直接在Telegram上问它。用了两周左右,明显能感觉到它对我的项目上下文越来越熟悉了。
当然它还远不完美,偶尔会有奇怪的幻觉,技能创建的质量也参差不齐,多平台网关偶尔掉线。但作为一个v0.7.0的项目,这个完成度我觉得已经相当可以了。
Agent这个赛道已经卷了一年多了。但大部分产品都在卷「能调用多少工具」「能接多少API」这种外延式的东西。Hermes是我第一次看到有团队认真地去做「Agent的内在成长」。
这可能才是AI Agent真正有意思的方向。
我突然想到一个词,日本人叫它「育成」。养电子宠物、培养游戏角色、甚至盆栽,都属于育成的范畴。人类天生就对「看着一个东西慢慢成长」这件事有执念。Hermes让我第一次对一个AI产品产生了类似的感觉,它不是一个工具,更像是一个需要你投入时间去培养的伙伴。你给它的信息越多、用得越久,它就越懂你。
这种关系,跟「打开→使用→关闭」的工具逻辑完全不同。
不是做一个无所不能的工具,而是做一个会跟你一起变强的伙伴。
参考资料
1. Hermes Agent 官方仓库 - Nous Research
https://github.com/NousResearch/hermes-agent2. Hermes Agent 官方文档(中文)
https://hermes-agent.org/zh/3. Hermes Agent 橙皮书深度解读 - alchaincyf
https://github.com/alchaincyf/hermes-agent-orange-book4. Hermes Agent 菜鸟教程
https://www.runoob.com/ai-agent/hermes-agent.html5. 「Hermes Agent凭什么突然火了?」 - CSDN
https://blog.csdn.net/problc/article/details/1599405276. 「Hermes Agent vs OpenClaw深度对比」 - 腾讯云开发者社区
https://cloud.tencent.com/developer/article/26529457. 「Hermes Agent深度技术解析」 - 知乎专栏
https://zhuanlan.zhihu.com/p/2022015752258027715
夜雨聆风