61k Star 的 AI Agent 诞生了内置学习循环
我用它替代了 Cursor 和 Copilot
61.9k Star、3,947 Commits、v0.8.0——Hermes Agent 是唯一一个内置学习循环的 AI Agent。它能从对话中创建 Skills,在使用中自我改进,还能跨平台工作。我用了两周,Cursor 和 Copilot 的订阅都暂停了。
前言
作为一个天天和代码打交道的人,我用过不少 AI 编程工具。Cursor 的代码补全很舒服,Copilot 的上下文理解也不错。但用久了,我发现一个共同的问题——它们都是"stateless"的。
什么意思?就是我每次新开一个对话,AI 什么都不记得。它不知道我上次为什么放弃了某个方案,不知道我踩过什么坑,更不知道我的代码风格偏好。每次都要重新开始,像和一个失忆的助手合作。
直到我遇到了 Hermes Agent。
这是 Nous Research 开源的项目,Star 数 61.9k——这个数字在 AI Agent 领域相当炸裂。更重要的是,它是唯一一个内置学习循环的 AI Agent——它能从对话中创建 Skills,在使用中自我改进,还能跨会话搜索历史。
用了两周后,我把 Cursor 和 Copilot 的订阅都暂停了。
项目概述
一句话:Hermes 是一个自我进化的 AI Agent,不只帮你完成任务,还会在过程中学习你的习惯和偏好,下次变得更好用。
| 模块 | 功能点 | 内置数量/说明 |
|---|---|---|
| 对话接口 | CLI / Telegram / Discord / Slack / WhatsApp / Signal / Email | 7个平台 |
| 模型支持 | OpenRouter(200+) / OpenAI / Nous Portal / Google AI Studio / Kimi / MiniMax / Ollama | 7个聚合 |
| 工具系统 | 文件操作 / 代码执行 / Web搜索 / 数据库 / API调用 | 40+ |
| 记忆系统 | 持久记忆 / Skills / 用户画像 / 会话搜索 | 基于Honcho |
| 调度系统 | Cron定时任务 / 跨平台推送 / 后台任务通知 | 完整实现 |
核心价值
解决什么痛点?
没有学习能力的 Agent = 每次都从零开始
我用 Copilot 的时候,每次都要重新告诉它我的代码风格。用 Hermes 之后,它记住了我的偏好——我偏好用 Python type hint,我喜欢用 pydantic 做数据验证。第二次对话时,它直接给出了符合我习惯的代码。
没有跨平台能力的 Agent = 在不同工具间疲于奔命
我在终端写代码,但有时出门在外只能用手机。Hermes 的 Gateway 架构让我在 Telegram 上继续和它对话,它记得我们聊到哪了。
部署不灵活的 Agent = 要么太贵要么太麻烦
Hermes 支持 6 种终端后端:本地、Docker、SSH、Daytona、Singularity、Modal。我现在跑在 Modal 上,闲置时几乎不花钱。
横向对比
| 维度 | Hermes Agent | Cursor | Copilot |
|---|---|---|---|
| 学习能力 | ✅ 内置学习循环 | ❌ 无 | ❌ 无 |
| 多平台 | 7个消息平台 | 仅桌面 | 仅IDE |
| 模型选择 | 200+模型,随切随用 | 固定 | 固定 |
| 部署方式 | 6种后端 | 仅本地 | 云端 |
| 开源 | ✅ MIT协议 | ❌ 闭源 | ❌ 闭源 |
| 价格 | 免费(自选模型) | $20/月 | $10/月 |
快速上手
安装(30秒)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash source ~/.bashrc hermes
安装脚本会自动检测你的平台(Linux/macOS/WSL2/Termux),处理所有依赖。
配置模型
hermes model # 交互式选择模型提供商 # 推荐:OpenRouter(200+模型可选)或 Nous Portal(免费额度)
第一个对话
$ hermes 🧙 Hermes Agent v0.8.0 Type /help for commands, /new for new conversation You: 用 Python 写一个快速排序 [Hermes 开始流式输出代码...]
💡 我的感受:终端界面很顺滑,多行编辑、命令补全、即时中断重定向都用得很舒服。typing 指示器我很喜欢,知道它在思考。
深度模块体验
1. 学习循环——这才是真正的 Agent
这是 Hermes 和其他工具最大的区别。
它怎么工作的?
正常 Agent:任务 → 完成 → 结束 → 下次从零开始
Hermes:任务 → 完成 → 反思 → 创建/更新 Skill → 下次自动调用
举个例子。我让它帮我审查一个 PR,它发现这个项目的代码风格和我之前提的不一致。它会问我:"要不要创建一个代码风格检查的 Skill?"我确认后,它就把这个规则存了下来。下次我让它审查 PR,它会自动应用这个风格检查。
内置的 skills 系统:Skills 是持久化的执行单元,可以跨会话复用。它们存储在 ~/.hermes/skills/,支持 agentskills.io 开放标准。
💡 我的感受:用了两周,我的 Skills 库已经有 12 个自定义 Skills 了。包括"审查代码风格"、"生成 REST API 文档"、"优化数据库查询"。每次复用都让我觉得它在真正为我工作。
2. 多平台消息网关——你的 Agent 跟着你走
启动 Gateway:
hermes gateway setup # 交互式配置 Telegram/Discord 等 hermes gateway start # 后台运行
配置好后,我打开 Telegram 给 bot 发消息,它在云端 VM 上跑,我还能看到它在终端的输出。
| 平台 | 特色功能 |
|---|---|
| Telegram | 群组话题绑定、审批按钮、emoji 状态 |
| Discord | 原生斜杠命令、频道控制 |
| Slack | 线程自动响应、审批按钮 |
| 语音转录、跨平台连续 | |
| Signal | 全媒体标签投递 |
| IMAP/SMTP 集成 |
💡 我的感受:我主要用 Telegram。有一次我在地铁上想起项目里有个 bug 用 Hermes 查过,但想不起具体在哪了。掏出手机翻了下 Telegram 聊天记录,三秒钟找到。这个体验太顺畅了。
3. 记忆系统——终于不是失忆症患者了
Hermes 的记忆系统有多个层次:
• 会话记忆:自动追踪当前对话上下文,支持 /compress 压缩上下文。
• 持久记忆:基于 Honcho 的用户画像,记录你的偏好、习惯、常用技术栈。
• 跨会话搜索:FTS5 全文搜索 + LLM 摘要压缩。三个月前的对话,它能理解并召回关键信息。
• Skills 记忆:每个 Skill 都有元数据,Agent 会根据上下文自动推荐合适的 Skills。
💡 我的感受:有次我忘了之前是怎么解决 Docker 网络隔离问题的,让 Hermes 帮我搜一下。它找到了 6 周前的对话,还给出了那次的解决方案和代码。比我自己翻历史记录还快。
4. 模型选择——不锁定,任何人都能用
/hermes model openrouter:anthropic/claude-3-5-sonnet /hermes model nous:portal/minimax-o3 /hermes model gemini:gemini-2.0-flash
支持任意 OpenAI 兼容端点。MiniMax 用户有福了——原生支持 minimax-m2.7 等模型。
💡 我的感受:我主力用 Claude Sonnet,但有时简单任务我会切到便宜 10 倍的模型省成本。一句话切换,这种灵活性我用得很爽。
5. Cron 调度——把你的 Agent 变成私人助理
用自然语言设置定时任务:
每天早上 9 点给我发送项目状态报告
每周五下午 6 点提醒我 review 本周代码
每月 1 号生成技术债务分析
💡 我的感受:我设置了一个"每日项目健康检查",每天早上 9 点它自动跑一遍测试和 lint,结果发到 Telegram。不用我动一根手指。
6. 终端后端——想跑哪就跑哪
| 后端 | 适用场景 | 成本 |
|---|---|---|
| 本地 | 开发调试 | 免费 |
| Docker | 隔离环境 | 免费 |
| SSH | 远程机器 | 免费 |
| Daytona | 云端持久化 | 按量 |
| Singularity | GPU 集群 | 按配置 |
| Modal | Serverless,闲置近乎零成本 | 按执行 |
💡 我的感受:我重度使用 Modal 方案。项目冷启动时它自动唤醒,处理完自动休眠。上个月账单 $0.87,对比之前 Copilot $10 的订阅,省了一大截。
技术架构
核心是标准的 Agent Loop:理解 → 规划 → 工具调用 → 反思 → 学习。各个子系统相互配合,Skills 系统连接记忆和执行。
主要模块:Gateway(消息网关)、Agent Core(核心Agent)、Memory System(记忆系统)、Skills Engine(技能引擎)、Tools System(工具系统)、Model Providers(模型供应商)
对比分析
与 LangChain Agents 对比
| 维度 | Hermes | LangChain Agents |
|---|---|---|
| 定位 | 终端+消息平台的用户级产品 | 开发者的框架/库 |
| 学习能力 | 内置,真实有效 | 需要自己实现 |
| 部署 | 开箱即用 | 需要大量定制 |
与 Open Interpreter 对比
| 维度 | Hermes | Open Interpreter |
|---|---|---|
| 多平台 | ✅ 原生支持 | ❌ 无 |
| 学习能力 | ✅ 有 | ❌ 无 |
| Skills 系统 | ✅ 完整实现 | ❌ 无 |
| 定价 | 模型自选,免费 | 云端需付费 |
受众画像
适合谁
| 用户类型 | 推荐理由 |
|---|---|
| 独立开发者 | 学习能力让 AI 越用越懂你,省时间 |
| 远程工作者 | 多平台支持,手机也能继续工作 |
| 技术团队 | 自托管,代码不外泄,支持 Claude/GPT |
| AI 爱好者 | 200+模型随便试,开源可定制 |
| 预算有限的开发者 | Modal 部署近乎零成本 |
不适合谁
• 重度 IDE 集成用户:Hermes 是 TUI/消息接口,不是 IDE 插件。如果你需要实时代码补全,Cursor 仍是更好的选择。
• 非技术用户:配置模型、处理 API Key 需要一定动手能力。
我的真实收获
用了两周 Hermes 后:
1. 效率提升:不再重复告诉 AI 我的偏好,每个新会话都自动继承
2. 知识沉淀:12 个自定义 Skills 涵盖了我最常做的事
3. 成本降低:Modal 部署 + 自选便宜模型,月成本从 $30+ 降到 $5 以内
4. 工作连续性:地铁上也能用 Telegram 继续项目工作
学完/用完我能做什么:
• 用自然语言调度定时任务
• 跨设备继续未完成的编程讨论
• 让 AI 从错误中学习,下次不再犯
• 在多个模型间切换,找到最优性价比
结尾
Hermes Agent 解决了一个根本问题:AI Agent 不应该是"每次都从零开始"的工具,而应该是一个会学习、会成长、真正属于你的数字伙伴。
61.9k 的 Star 不是吹出来的。两周使用下来,它的 Skills 系统、多平台网关、学习闭环确实让我眼前一亮。
如果你也在用 Cursor 或 Copilot,不妨给 Hermes 一个机会。它可能会成为你编程工具链里那个"缺失的链接"。
官网:https://hermes-agent.nousresearch.com/docs/
GitHub:https://github.com/NousResearch/hermes-agent
Discord:https://discord.gg/NousResearch
*本文由饶工原创,调研于 2026 年 4 月 12 日。项目版本 v0.8.0,后续更新请以官方仓库为准。*
夜雨聆风