Hermes Agent:免费AI助手,代码里藏了训练管道
7 周,80,000 Stars。Hermes Agent 看起来是”越用越聪明的 AI 助手”,但真相远比这有意思。
如果你最近刷 GitHub,大概率见过这个项目。
2026 年 2 月底上线,7 周 80,000 Stars,周增长率接近 500%。一个叫 Hermes Agent 的开源项目,号称”会自学习的 AI 助手”——你用得越多,它就越聪明。
听起来很美好对吧。
我也是这么觉得的。直到我翻了它的源码,在一个叫 tinker-atropos 的文件夹里,发现了一整套强化学习训练管道。
一个面向终端用户的 Agent 产品,为什么会内置完整的模型训练基础设施?
这条线索往下挖,扯出了一个比”数据飞轮”复杂得多的故事。
先说结论,再说过程
核心判断:Hermes Agent 不是”骗局”,而是一家估值 10 亿美元的开源 AI 实验室,在生死存亡线上的一次多目标生存实验。
它同时做了三件事:
-
🔄 用免费产品构建数据飞轮,降低训练数据获取成本 -
📐 推动技能开放标准,试图成为 Agent 生态的”Docker Hub” -
🔥 用 80,000 Stars 维持社区热度,为下一轮融资储备弹药
这三个目标彼此支撑。数据飞轮喂养模型,标准制定锁定生态,社区热度吸引资本。
但它们各自的风险也彼此叠加。
以下基于 20+ 外文一手信源交叉验证,文末附完整出处。
第一层:那个文件夹里到底有什么
tinker-atropos 的工作流程是这样的:
你用 Hermes 完成一个任务——比如让它帮你写一段代码、整理一份文件。这个过程中,AI 每一次”思考→工具调用→结果验证”的完整轨迹,都会被自动记录。
然后,内置的压缩器把这些轨迹标准化。接着,Atropos 模块用 GRPO 算法配合 LoRA 微调,跑一轮训练。
整个过程中,你看不到任何提示。
GRPO 是什么?就是 DeepSeek-R1 用的那个强化学习算法。LoRA 微调是当前最高效的低成本模型训练方式。它们被完整地塞进了一个”免费 AI 助手”里。
GitHub 上有一份专门分析 agentic RL data flywheel 的结构化报告(agent-native-scriptorium 仓库,2026 年 4 月 10 日更新),把这种飞轮拆成了三层:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
| Agentic RL 飞轮 | 在多步任务中优化行为策略 | Hermes Agent(目前唯一开源实现) |
报告特别提了一句:“伦理风险必须前置治理”——数据隐私、用户同意机制、评估偏差,这些在飞轮模式下绕不开。
而 Hermes Agent 的 README 里,对这些问题的描述只有几行。
第二层:这个团队的真实处境
我最初以为 Nous Research 就是”做开源大模型的”,跟 Stability AI、Mistral 差不多。
错了。
2025 年 4 月,Fortune 发了一篇独家报道(后被 Cointelegraph 等多家媒体跟进):一家叫 Paradigm 的加密风投公司——就是投过 Uniswap、dYdX、Optimism 的那个——领投了 Nous Research 的 A 轮。
5000 万美元。Token 估值 10 亿美元。
这是 Paradigm 在 AI 领域最大的一笔投资。
Nous Research 的联合创始人 Karan Malhotra(社区昵称 Teknium),2022 年在 Discord 上拉了几个人开始搞开源 AI。2023 年去过 Stability AI 做数据工程,然后回来全职做 Nous。
他们的核心方向不是”做一个好用的 Agent”。而是:
用去中心化的方式训练大模型。
具体做法是:通过 Solana 区块链,协调全球分布的闲置 GPU 算力来训练模型。用拜占庭容错防止恶意数据投毒。用户贡献算力,获得代币奖励。
2024 年底,他们已经用这种方式预训练了一个 15B 参数的模型,并且全程直播训练过程。
这也解释了 Hermes Agent 的真实定位——它不是 Nous Research 的核心产品,而是核心产品(去中心化训练基础设施)的一个前端实验。
第三层:10 亿美元的阴影
但故事到这里,出现了一个巨大的裂缝。
2026 年 2 月 18 日,Via News 发了一篇分析文章,标题是《Nous Research Faces the Frontier Paradox》——Nous Research 面临的前沿悖论。
文章引用分析师的评估,直说了:
“Nous Research 的财务状况是灾难性的。”
5000 万美元听起来很多,但前沿模型单次训练成本数千万美元。跑几次就能把资金消耗大半。而且——
开源模型几乎无法产生经常性收入。
没有 API 变现,没有企业合同,没有订阅服务。你是免费的,用户也是免费的。钱从哪来?
这就是 Hermes Agent 出现的真正背景:一家估值 10 亿美元的公司,其实非常缺钱。
第四层:所以它是”骗局”吗?
如果你只到这里就下结论,你会说:
“又是一个把用户当免费数据标注员的套路。”
说实话,我也差点停在这里。
但有两个信息让我犹豫了。
第一个:通用 Agent 的数据质量其实很差。
agent-native-scriptorium 的分析指出,数据飞轮在垂直领域(法律、医疗、金融)才容易跑通——因为任务重复性强、专家反馈明确、付费意愿高。
而 Hermes Agent 是一个通用 Agent。用户用它写代码、整理文件、查资料,产生的轨迹数据杂乱无章。如果 Nous Research 真的只是想”收割”高质量训练数据,做一个垂直领域 Agent 明显更聪明。
第二个:数据飞轮不是 Hermes 唯一在赌的东西。
如果只是为了收集训练数据,Hermes Agent 是一个效率极低的选择。它做了太多”不必要”的事。
第五层:你可能忽略了的一条暗线
前面说的所有事——数据飞轮、融资、财务困境——都集中在”模型”上。但 Hermes Agent 还做了另一件事,鲜少被讨论。
它正在定义一种叫 SKILL.md 的开放格式规范。
SKILL.md 是一种 Agent 技能的标准描述方式——用 YAML + Markdown,定义一个 AI Agent 如何完成特定任务。
这个标准目前的状态:
- Claude Code(Anthropic 官方 CLI)已原生支持
- OpenAI Codex兼容
- OpenClaw兼容
- skillsmp.com 上已有 80 万+ 个基于此格式的技能
- Hermes Agent 是这个标准的主要推动者
你知道这意味着什么吗?
Hermes 正在尝试定义 Agent 技能领域的”容器镜像格式”。
2013 年,Docker 定义了容器镜像的标准格式。然后 Docker Hub 成为容器生态的入口。然后 Kubernetes 在这个标准上构建了整个云原生世界。
如果 SKILL.md 成为行业标准(目前看来概率不小),作为主要推动者的 Hermes,就掌握了类似 Docker Hub 的位置——不是通过垄断技术,而是通过定义标准。
这比收集训练数据的商业价值大得多,也持久得多。
数据飞轮是战术。标准制定是战略。
回头看 Hermes Agent 的产品设计:三级渐进式 Skill 加载(L0 列表摘要 → L1 完整内容 → L2 引用文件)、自改进的技能文档、与 agentskills.io 的原生集成——这一切不是巧合。
它在用产品来推动标准的采纳。
工程水平到底怎么样
英文社区有一篇比较客观的评测(opc.community,2026 年 4 月 9 日):
✅ 做得好的:
-
数据隐私、可定制性、多平台集成显著优于闭源竞品
-
长期使用成本极低(5 美元/月 VPS 即可运行)
-
40+ 内置工具,自改进能力在开源 Agent 中确实领先
❌ 做得不够的:
-
GPT-4 在部分推理任务上仍然更强
-
UI 精致度和开箱即用体验不如 Manus、Genspark
-
文档和教程以英文为主
我逐一翻了 GitHub Issues(1500+ open),结论相似:并发安全缺陷、基础级 NameError、配置管理混乱、企业级集成不稳定。
综合判断:
架构设计超前(三级 Skill 加载 + RL 集成),但工程化水平大约是 v0.9。不适合生产环境,但作为研究平台和开发者玩具够用了。
这件事真正值得关注的三个点
上面讲的是一个团队、一个项目的故事。但如果拉远视角,这件事折射出的三个行业趋势,可能比故事本身更重要。
① 开源 AI 的”免费”正在变得越来越贵。
独立 AI 实验室普遍面临一个结构性困境:一边是资金雄厚的大厂,一边是期望免费获得强大模型的开源社区。Hermes Agent 的出现——无论是否带有数据采集目的——都是这个困境的直接产物。
当直接卖模型的钱不够烧的时候,用户数据是最直接的选择。但它也是最危险的选择。
② “Agent 即数据源”这个模式,巨头迟早会跟进。
TikTok、Google Maps、Tesla Fleet Learning——都在各自领域验证过”用户使用产生数据,数据改进产品”的飞轮模式。AI Agent 只是把同样的逻辑搬到了新场景。
当 OpenAI 或 Anthropic 推出自己的版本时,模型优势 + 用户规模会让飞轮转得更快。
到那时候,谁先定义了标准,谁才有资格坐在牌桌上。
③ Hermes 赌的不是产品,是基础设施。
80 万个 SKILL.md 技能、Claude Code 和 OpenClaw 的兼容——这不是一个开源项目的体量。而如果你在 Agent 生态的早期就定义了”技能描述的标准格式”,你就占据了类似 Docker Hub 的位置。
这才是这个故事最值得思考的地方。
最后说一个细节
Nous Research 的代币还没有发行。
他们拿了 10 亿美元估值。投资方 Paradigm 是 crypto native 的。训练基础设施建在 Solana 上。代币经济学的细节从未公开。
Hermes Agent 是 MIT 协议,完全免费,不要钱。
但在这个故事的底层,有一家正在用免费产品获取数据、用开放标准锁定生态的 10 亿美元公司,等待着一个尚未发行的代币来完成最终的闭环。
这个故事到底该怎么评价?
说实话,我不确定。
但我确定的是,它是 2026 年开源 AI 领域最值得被看见的一次商业实验。
你怎么看?欢迎在评论区聊聊。
本文基于 GitHub 源码及 Issues、Fortune 独家报道、Cointelegraph、Via News Frontier Paradox 分析、agent-native-scriptorium 技术分析、opc.community 英文评测、Teknium 个人网站、agentskills.io 规范文档等 20+ 来源交叉验证。数据截至 2026 年 4 月 15 日。
夜雨聆风