Hermes Agent:免费AI助手,代码里藏了训练管道-夜雨聆风

Hermes Agent:免费AI助手,代码里藏了训练管道

7 周，80,000 Stars。Hermes Agent 看起来是”越用越聪明的 AI 助手”，但真相远比这有意思。

如果你最近刷 GitHub，大概率见过这个项目。

2026 年 2 月底上线，7 周 80,000 Stars，周增长率接近 500%。一个叫 Hermes Agent 的开源项目，号称”会自学习的 AI 助手”——你用得越多，它就越聪明。

听起来很美好对吧。

我也是这么觉得的。直到我翻了它的源码，在一个叫 tinker-atropos 的文件夹里，发现了一整套强化学习训练管道。

一个面向终端用户的 Agent 产品，为什么会内置完整的模型训练基础设施？

这条线索往下挖，扯出了一个比”数据飞轮”复杂得多的故事。

先说结论，再说过程

核心判断：Hermes Agent 不是”骗局”，而是一家估值 10 亿美元的开源 AI 实验室，在生死存亡线上的一次多目标生存实验。

它同时做了三件事：

🔄 用免费产品构建数据飞轮，降低训练数据获取成本
📐 推动技能开放标准，试图成为 Agent 生态的”Docker Hub”
🔥 用 80,000 Stars 维持社区热度，为下一轮融资储备弹药

这三个目标彼此支撑。数据飞轮喂养模型，标准制定锁定生态，社区热度吸引资本。

但它们各自的风险也彼此叠加。

以下基于 20+ 外文一手信源交叉验证，文末附完整出处。

第一层：那个文件夹里到底有什么

tinker-atropos 的工作流程是这样的：

你用 Hermes 完成一个任务——比如让它帮你写一段代码、整理一份文件。这个过程中，AI 每一次”思考→工具调用→结果验证”的完整轨迹，都会被自动记录。

然后，内置的压缩器把这些轨迹标准化。接着，Atropos 模块用 GRPO 算法配合 LoRA 微调，跑一轮训练。

整个过程中，你看不到任何提示。

GRPO 是什么？就是 DeepSeek-R1 用的那个强化学习算法。LoRA 微调是当前最高效的低成本模型训练方式。它们被完整地塞进了一个”免费 AI 助手”里。

GitHub 上有一份专门分析 agentic RL data flywheel 的结构化报告（agent-native-scriptorium 仓库，2026 年 4 月 10 日更新），把这种飞轮拆成了三层：

层级	做什么	代表案例
应用层飞轮	用使用日志优化工作流	Notion AI、Cursor
模型层飞轮	用高质量数据做微调	Tesla Fleet Learning
Agentic RL 飞轮	在多步任务中优化行为策略	Hermes Agent（目前唯一开源实现）

报告特别提了一句：“伦理风险必须前置治理”——数据隐私、用户同意机制、评估偏差，这些在飞轮模式下绕不开。

而 Hermes Agent 的 README 里，对这些问题的描述只有几行。

第二层：这个团队的真实处境

我最初以为 Nous Research 就是”做开源大模型的”，跟 Stability AI、Mistral 差不多。

错了。

2025 年 4 月，Fortune 发了一篇独家报道（后被 Cointelegraph 等多家媒体跟进）：一家叫 Paradigm 的加密风投公司——就是投过 Uniswap、dYdX、Optimism 的那个——领投了 Nous Research 的 A 轮。

5000 万美元。Token 估值 10 亿美元。

这是 Paradigm 在 AI 领域最大的一笔投资。

Nous Research 的联合创始人 Karan Malhotra（社区昵称 Teknium），2022 年在 Discord 上拉了几个人开始搞开源 AI。2023 年去过 Stability AI 做数据工程，然后回来全职做 Nous。

他们的核心方向不是”做一个好用的 Agent”。而是：

用去中心化的方式训练大模型。

具体做法是：通过 Solana 区块链，协调全球分布的闲置 GPU 算力来训练模型。用拜占庭容错防止恶意数据投毒。用户贡献算力，获得代币奖励。

2024 年底，他们已经用这种方式预训练了一个 15B 参数的模型，并且全程直播训练过程。

这也解释了 Hermes Agent 的真实定位——它不是 Nous Research 的核心产品，而是核心产品（去中心化训练基础设施）的一个前端实验。

第三层：10 亿美元的阴影

但故事到这里，出现了一个巨大的裂缝。

2026 年 2 月 18 日，Via News 发了一篇分析文章，标题是《Nous Research Faces the Frontier Paradox》——Nous Research 面临的前沿悖论。

文章引用分析师的评估，直说了：

“Nous Research 的财务状况是灾难性的。”

5000 万美元听起来很多，但前沿模型单次训练成本数千万美元。跑几次就能把资金消耗大半。而且——

开源模型几乎无法产生经常性收入。

没有 API 变现，没有企业合同，没有订阅服务。你是免费的，用户也是免费的。钱从哪来？

这就是 Hermes Agent 出现的真正背景：一家估值 10 亿美元的公司，其实非常缺钱。

第四层：所以它是”骗局”吗？

如果你只到这里就下结论，你会说：

“又是一个把用户当免费数据标注员的套路。”

说实话，我也差点停在这里。

但有两个信息让我犹豫了。

第一个：通用 Agent 的数据质量其实很差。

agent-native-scriptorium 的分析指出，数据飞轮在垂直领域（法律、医疗、金融）才容易跑通——因为任务重复性强、专家反馈明确、付费意愿高。

而 Hermes Agent 是一个通用 Agent。用户用它写代码、整理文件、查资料，产生的轨迹数据杂乱无章。如果 Nous Research 真的只是想”收割”高质量训练数据，做一个垂直领域 Agent 明显更聪明。

第二个：数据飞轮不是 Hermes 唯一在赌的东西。

如果只是为了收集训练数据，Hermes Agent 是一个效率极低的选择。它做了太多”不必要”的事。

第五层：你可能忽略了的一条暗线

前面说的所有事——数据飞轮、融资、财务困境——都集中在”模型”上。但 Hermes Agent 还做了另一件事，鲜少被讨论。

它正在定义一种叫 SKILL.md 的开放格式规范。

SKILL.md 是一种 Agent 技能的标准描述方式——用 YAML + Markdown，定义一个 AI Agent 如何完成特定任务。

这个标准目前的状态：

Claude Code（Anthropic 官方 CLI）已原生支持

OpenAI Codex兼容

OpenClaw兼容

skillsmp.com 上已有 80 万+ 个基于此格式的技能

Hermes Agent 是这个标准的主要推动者

你知道这意味着什么吗？

Hermes 正在尝试定义 Agent 技能领域的”容器镜像格式”。

2013 年，Docker 定义了容器镜像的标准格式。然后 Docker Hub 成为容器生态的入口。然后 Kubernetes 在这个标准上构建了整个云原生世界。

如果 SKILL.md 成为行业标准（目前看来概率不小），作为主要推动者的 Hermes，就掌握了类似 Docker Hub 的位置——不是通过垄断技术，而是通过定义标准。

这比收集训练数据的商业价值大得多，也持久得多。

数据飞轮是战术。标准制定是战略。

回头看 Hermes Agent 的产品设计：三级渐进式 Skill 加载（L0 列表摘要 → L1 完整内容 → L2 引用文件）、自改进的技能文档、与 agentskills.io 的原生集成——这一切不是巧合。

它在用产品来推动标准的采纳。

工程水平到底怎么样

英文社区有一篇比较客观的评测（opc.community，2026 年 4 月 9 日）：

✅ 做得好的：

数据隐私、可定制性、多平台集成显著优于闭源竞品

长期使用成本极低（5 美元/月 VPS 即可运行）

40+ 内置工具，自改进能力在开源 Agent 中确实领先

❌ 做得不够的：

GPT-4 在部分推理任务上仍然更强

UI 精致度和开箱即用体验不如 Manus、Genspark

文档和教程以英文为主

我逐一翻了 GitHub Issues（1500+ open），结论相似：并发安全缺陷、基础级 NameError、配置管理混乱、企业级集成不稳定。

综合判断：

架构设计超前（三级 Skill 加载 + RL 集成），但工程化水平大约是 v0.9。不适合生产环境，但作为研究平台和开发者玩具够用了。

这件事真正值得关注的三个点

上面讲的是一个团队、一个项目的故事。但如果拉远视角，这件事折射出的三个行业趋势，可能比故事本身更重要。

① 开源 AI 的”免费”正在变得越来越贵。

独立 AI 实验室普遍面临一个结构性困境：一边是资金雄厚的大厂，一边是期望免费获得强大模型的开源社区。Hermes Agent 的出现——无论是否带有数据采集目的——都是这个困境的直接产物。

当直接卖模型的钱不够烧的时候，用户数据是最直接的选择。但它也是最危险的选择。

② “Agent 即数据源”这个模式，巨头迟早会跟进。

TikTok、Google Maps、Tesla Fleet Learning——都在各自领域验证过”用户使用产生数据，数据改进产品”的飞轮模式。AI Agent 只是把同样的逻辑搬到了新场景。

当 OpenAI 或 Anthropic 推出自己的版本时，模型优势 + 用户规模会让飞轮转得更快。

到那时候，谁先定义了标准，谁才有资格坐在牌桌上。

③ Hermes 赌的不是产品，是基础设施。

80 万个 SKILL.md 技能、Claude Code 和 OpenClaw 的兼容——这不是一个开源项目的体量。而如果你在 Agent 生态的早期就定义了”技能描述的标准格式”，你就占据了类似 Docker Hub 的位置。

这才是这个故事最值得思考的地方。

最后说一个细节

Nous Research 的代币还没有发行。

他们拿了 10 亿美元估值。投资方 Paradigm 是 crypto native 的。训练基础设施建在 Solana 上。代币经济学的细节从未公开。

Hermes Agent 是 MIT 协议，完全免费，不要钱。

但在这个故事的底层，有一家正在用免费产品获取数据、用开放标准锁定生态的 10 亿美元公司，等待着一个尚未发行的代币来完成最终的闭环。

这个故事到底该怎么评价？

说实话，我不确定。

但我确定的是，它是 2026 年开源 AI 领域最值得被看见的一次商业实验。

你怎么看？欢迎在评论区聊聊。

本文基于 GitHub 源码及 Issues、Fortune 独家报道、Cointelegraph、Via News Frontier Paradox 分析、agent-native-scriptorium 技术分析、opc.community 英文评测、Teknium 个人网站、agentskills.io 规范文档等 20+ 来源交叉验证。数据截至 2026 年 4 月 15 日。