【AI工具】Hermes Agent [爱马仕] 实测:这个开源AI智能体越用越聪明
— 一粒黑子 · 落子AI新世界 —
腾讯10+年程序员 | AI工具实战派
2026年2月,Nous Research悄悄在GitHub上放了个项目叫Hermes Agent。一个多月,60000多Stars。我花了三天时间折腾了一圈,想跟你们聊聊这东西到底值不值得关注。
一、先说清楚这东西到底是啥
不是又一个ChatGPT套壳。
这句话我得先放前面,因为现在市面上太多打着”AI Agent”旗号的东西,打开一看就是个聊天界面加了几个按钮。Hermes Agent不太一样,它是真的住在你自己电脑上的,不是云端的,数据全部存在本地~/.hermes/目录下。MIT协议完全开源,代码想审就审。
怎么说呢。
如果非要找个类比的话,它更像是你雇了一个住家的助手——不是那种打一次电话来一次的钟点工,是真的住在你家、了解你习惯、越待越顺手的那种。Nous Research(就是做Hermes系列模型的那个团队)搞这个项目的核心思路就四个字:自我进化。
二、三层记忆——这是我觉得最牛的地方
别的AI工具是金鱼记忆。
对,我知道现在很多产品都说自己有”记忆”功能了,但大部分要么是聊天记录搜索,要么是存了几条用户偏好就号称长期记忆。Hermes Agent搞了个三层架构,我觉得设计思路是真的清晰:
🧠 三层记忆系统
• 会话记忆:当前对话的上下文,这个大家都有
• 持久记忆:跨会话的用户偏好和项目信息,基于FTS5全文搜索+LLM摘要
• 技能记忆:这个是杀手锏——它会把解决过的问题自动写成可复用的技能文档
最后这个技能记忆有多离谱呢。比如你让它帮你写了个部署脚本,它不只是执行完拉倒,它会自动把”怎么部署”这件事抽象成一个Skill存下来。下次你说”帮我把新项目也部署了”,它直接调之前的经验,不用你再解释一遍。
而且这些Skill还会在使用过程中自己优化。
说实话我第一次看到这个设计的时候,脑子里就蹦出来一个词——肌肉记忆。你想啊,人类学骑自行车也是这样,前几次歪歪扭扭,练多了身体就记住了。Hermes的技能记忆本质上就是在做这件事。
三、多平台网关+定时任务——日常实用的部分
这部分可能对非程序员来说更实在一些。
Hermes Agent内置了一个消息网关,支持Telegram、Discord、Slack、WhatsApp、Signal五个平台,外加CLI终端。什么概念呢,你可以在手机的Telegram上跟它说”帮我看下服务器有没有报错”,它直接在你服务器上执行命令,把结果发回来。然后你回到家打开终端,接着之前的话题继续聊,记忆是通的,不会断。
哦对了,还有cron定时任务。
你可以设置”每天早上8点帮我总结昨天的邮件”、”每周一出一份项目进度报告”,完全无人值守。它会按时跑完然后把结果推到你指定的平台上。我设了一个每天晚上帮我检查代码仓库是否有未处理的PR,用了一周了,确实比自己记着方便。
💡 实测小技巧:用hermes gateway setup 配置好Telegram之后,在手机上操作服务器这件事变的丝滑了很多。比SSH客户端方便,因为它能理解自然语言,你不用记命令。
四、模型无关——这个设计太聪明了
说到模型这块,Hermes Agent的策略是”模型可替换,工作流是你的”。支持4种接入方式:Nous Portal原生集成、OpenRouter(200多个模型随便挑)、任何OpenAI兼容的API端点、以及本地vLLM。
为什么说这个设计聪明呢。
你想想看,现在大模型更新迭代的速度有多快。今天Claude最强,明天可能GLM-5.1就赶上来了,后天又出了个新的。如果你的Agent绑死在某个模型上,那你的所有积累——记忆、技能、工作流——全部跟着那个模型走。模型一换,啥都得重来。但Hermes把这层解耦了,你积累的所有东西跟模型无关,换模型跟换手机壳一样,外面换了里面的数据照用。
而且它还有个骚操作——RL训练轨迹导出。每次执行任务的完整过程都会被记录,你可以导出这些轨迹数据,拿去微调一个小模型。用大模型干活攒数据,再用数据训练小模型替代大模型,逐步降低API成本。这就是所谓的”数据飞轮”。
格局确实大。
五、安装体验——一行命令搞定
这块直接上步骤吧,没什么好说的,确实简单:
1️⃣ 一键安装:curl -fsSL那个脚本跑一下,自动装好uv和Python 3.11
2️⃣ 交互配置:hermes setup → hermes model 选模型
3️⃣ 开聊:直接输入 hermes 就能用了
4️⃣ 可选:hermes gateway setup接入消息平台
支持Linux、macOS、WSL2。原生Windows还是实验阶段,不太推荐直接用。
整个过程大概2分钟就完事了。比起那些装个Agent要折腾半天环境的,这用户体验确实好不少。
六、说说不太行的地方
吹完了该说点实话了。
首先,v0.7.0还是早期版本,780个open issues搁那摆着呢。我用的这几天碰到过两次莫名其妙的报错,虽然重启就好了吧,但说明稳定性还有空间。其次,自进化创建的那些Skills,质量参差不齐。有的确实好用,有的你回头看看觉得不如自己手写一个。官方也承认了这点,说还在验证中。
还有就是生态问题。agentskills.io上面的技能数量跟人家ClawHub的3万多个比,差距还是蛮明显的。当然了,Hermes主打的不是手动下载别人写的技能,而是自己用着用着就生成了,逻辑不太一样。但对于新用户来说,冷启动阶段没什么现成的技能可以用,体验会打折扣。
最后一个很现实的问题——底层模型决定上限。你拿Claude Opus来驱动Hermes,那体验确实丝滑。但如果用个7B的小模型,那完全不是一个水平,有的任务直接就做不出来。Hermes自己不提供模型,它只是个框架,天花板在模型那里。
七、我的判断
🧑💻 老码农说两句
2023到2024年,大家比的是AI能干什么。2025到现在,比的是AI能记住什么、能进化什么。Hermes Agent把这个趋势具象化了——你的AI助手不应该每次见面都像第一次认识,它应该是用的越久越懂你的。
适合什么人用呢?我觉得两类:一是在意数据隐私、不想把东西放云上的;二是有模型微调需求、想搞数据飞轮的团队。如果你只是想要个能用的AI助手,不太在乎这些花里胡哨的,那现有的方案可能够用了。
反正我是打算继续用一段时间看看。毕竟它说越用越聪明嘛,我倒要看看三个月后它能聪明到什么程度。
💬 互动时间
你觉得AI Agent最该具备的能力是什么?是记忆、自学习、还是多平台?评论区来聊
觉得有用就点个 「在看」 和 「赞」 吧 👇
#HermesAgent #AI智能体 #开源AI #AIAgent #自托管 #NousResearch #程序员 #效率工具 #AI工具 #模型无关
夜雨聆风