乐于分享
好东西不私藏

Hermes Agent:免费AI助手,代码里藏了训练管道

Hermes Agent:免费AI助手,代码里藏了训练管道

7 周,80,000 Stars。Hermes Agent 看起来是”越用越聪明的 AI 助手”,但真相远比这有意思。

如果你最近刷 GitHub,大概率见过这个项目。

2026 年 2 月底上线,7 周 80,000 Stars,周增长率接近 500%。一个叫 Hermes Agent 的开源项目,号称”会自学习的 AI 助手”——你用得越多,它就越聪明。

听起来很美好对吧。

我也是这么觉得的。直到我翻了它的源码,在一个叫 tinker-atropos 的文件夹里,发现了一整套强化学习训练管道

一个面向终端用户的 Agent 产品,为什么会内置完整的模型训练基础设施?

这条线索往下挖,扯出了一个比”数据飞轮”复杂得多的故事。


先说结论,再说过程

核心判断:Hermes Agent 不是”骗局”,而是一家估值 10 亿美元的开源 AI 实验室,在生死存亡线上的一次多目标生存实验

它同时做了三件事:

  • 🔄 用免费产品构建数据飞轮,降低训练数据获取成本
  • 📐 推动技能开放标准,试图成为 Agent 生态的”Docker Hub”
  • 🔥 用 80,000 Stars 维持社区热度,为下一轮融资储备弹药

这三个目标彼此支撑。数据飞轮喂养模型,标准制定锁定生态,社区热度吸引资本。

但它们各自的风险也彼此叠加。

以下基于 20+ 外文一手信源交叉验证,文末附完整出处。


第一层:那个文件夹里到底有什么

tinker-atropos 的工作流程是这样的:

你用 Hermes 完成一个任务——比如让它帮你写一段代码、整理一份文件。这个过程中,AI 每一次”思考→工具调用→结果验证”的完整轨迹,都会被自动记录

然后,内置的压缩器把这些轨迹标准化。接着,Atropos 模块用 GRPO 算法配合 LoRA 微调,跑一轮训练。

整个过程中,你看不到任何提示。

GRPO 是什么?就是 DeepSeek-R1 用的那个强化学习算法。LoRA 微调是当前最高效的低成本模型训练方式。它们被完整地塞进了一个”免费 AI 助手”里。

GitHub 上有一份专门分析 agentic RL data flywheel 的结构化报告(agent-native-scriptorium 仓库,2026 年 4 月 10 日更新),把这种飞轮拆成了三层:

层级
做什么
代表案例
应用层飞轮
用使用日志优化工作流
Notion AI、Cursor
模型层飞轮
用高质量数据做微调
Tesla Fleet Learning
Agentic RL 飞轮 在多步任务中优化行为策略 Hermes Agent(目前唯一开源实现)

报告特别提了一句:“伦理风险必须前置治理”——数据隐私、用户同意机制、评估偏差,这些在飞轮模式下绕不开。

而 Hermes Agent 的 README 里,对这些问题的描述只有几行。


第二层:这个团队的真实处境

我最初以为 Nous Research 就是”做开源大模型的”,跟 Stability AI、Mistral 差不多。

错了。

2025 年 4 月,Fortune 发了一篇独家报道(后被 Cointelegraph 等多家媒体跟进):一家叫 Paradigm 的加密风投公司——就是投过 Uniswap、dYdX、Optimism 的那个——领投了 Nous Research 的 A 轮。

5000 万美元。Token 估值 10 亿美元。

这是 Paradigm 在 AI 领域最大的一笔投资。

Nous Research 的联合创始人 Karan Malhotra(社区昵称 Teknium),2022 年在 Discord 上拉了几个人开始搞开源 AI。2023 年去过 Stability AI 做数据工程,然后回来全职做 Nous。

他们的核心方向不是”做一个好用的 Agent”。而是:

用去中心化的方式训练大模型。

具体做法是:通过 Solana 区块链,协调全球分布的闲置 GPU 算力来训练模型。用拜占庭容错防止恶意数据投毒。用户贡献算力,获得代币奖励。

2024 年底,他们已经用这种方式预训练了一个 15B 参数的模型,并且全程直播训练过程

这也解释了 Hermes Agent 的真实定位——它不是 Nous Research 的核心产品,而是核心产品(去中心化训练基础设施)的一个前端实验


第三层:10 亿美元的阴影

但故事到这里,出现了一个巨大的裂缝。

2026 年 2 月 18 日,Via News 发了一篇分析文章,标题是《Nous Research Faces the Frontier Paradox》——Nous Research 面临的前沿悖论。

文章引用分析师的评估,直说了:

“Nous Research 的财务状况是灾难性的。”

5000 万美元听起来很多,但前沿模型单次训练成本数千万美元。跑几次就能把资金消耗大半。而且——

开源模型几乎无法产生经常性收入。

没有 API 变现,没有企业合同,没有订阅服务。你是免费的,用户也是免费的。钱从哪来?

这就是 Hermes Agent 出现的真正背景:一家估值 10 亿美元的公司,其实非常缺钱


第四层:所以它是”骗局”吗?

如果你只到这里就下结论,你会说:

“又是一个把用户当免费数据标注员的套路。”

说实话,我也差点停在这里。

但有两个信息让我犹豫了。

第一个:通用 Agent 的数据质量其实很差。

agent-native-scriptorium 的分析指出,数据飞轮在垂直领域(法律、医疗、金融)才容易跑通——因为任务重复性强、专家反馈明确、付费意愿高。

而 Hermes Agent 是一个通用 Agent。用户用它写代码、整理文件、查资料,产生的轨迹数据杂乱无章。如果 Nous Research 真的只是想”收割”高质量训练数据,做一个垂直领域 Agent 明显更聪明。

第二个:数据飞轮不是 Hermes 唯一在赌的东西。

如果只是为了收集训练数据,Hermes Agent 是一个效率极低的选择。它做了太多”不必要”的事。


第五层:你可能忽略了的一条暗线

前面说的所有事——数据飞轮、融资、财务困境——都集中在”模型”上。但 Hermes Agent 还做了另一件事,鲜少被讨论。

它正在定义一种叫 SKILL.md 的开放格式规范。

SKILL.md 是一种 Agent 技能的标准描述方式——用 YAML + Markdown,定义一个 AI Agent 如何完成特定任务。

这个标准目前的状态:

  • Claude Code(Anthropic 官方 CLI)已原生支持
  • OpenAI Codex兼容
  • OpenClaw兼容
  • skillsmp.com 上已有 80 万+ 个基于此格式的技能
  • Hermes Agent 是这个标准的主要推动者

你知道这意味着什么吗?

Hermes 正在尝试定义 Agent 技能领域的”容器镜像格式”。

2013 年,Docker 定义了容器镜像的标准格式。然后 Docker Hub 成为容器生态的入口。然后 Kubernetes 在这个标准上构建了整个云原生世界。

如果 SKILL.md 成为行业标准(目前看来概率不小),作为主要推动者的 Hermes,就掌握了类似 Docker Hub 的位置——不是通过垄断技术,而是通过定义标准

这比收集训练数据的商业价值大得多,也持久得多。

数据飞轮是战术。标准制定是战略。

回头看 Hermes Agent 的产品设计:三级渐进式 Skill 加载(L0 列表摘要 → L1 完整内容 → L2 引用文件)、自改进的技能文档、与 agentskills.io 的原生集成——这一切不是巧合。

它在用产品来推动标准的采纳。


工程水平到底怎么样

英文社区有一篇比较客观的评测(opc.community,2026 年 4 月 9 日):

✅ 做得好的:

  • 数据隐私、可定制性、多平台集成显著优于闭源竞品
  • 长期使用成本极低(5 美元/月 VPS 即可运行)
  • 40+ 内置工具,自改进能力在开源 Agent 中确实领先

❌ 做得不够的:

  • GPT-4 在部分推理任务上仍然更强
  • UI 精致度和开箱即用体验不如 Manus、Genspark
  • 文档和教程以英文为主

我逐一翻了 GitHub Issues(1500+ open),结论相似:并发安全缺陷、基础级 NameError、配置管理混乱、企业级集成不稳定。

综合判断:

架构设计超前(三级 Skill 加载 + RL 集成),但工程化水平大约是 v0.9。不适合生产环境,但作为研究平台和开发者玩具够用了。


这件事真正值得关注的三个点

上面讲的是一个团队、一个项目的故事。但如果拉远视角,这件事折射出的三个行业趋势,可能比故事本身更重要。

① 开源 AI 的”免费”正在变得越来越贵。

独立 AI 实验室普遍面临一个结构性困境:一边是资金雄厚的大厂,一边是期望免费获得强大模型的开源社区。Hermes Agent 的出现——无论是否带有数据采集目的——都是这个困境的直接产物。

当直接卖模型的钱不够烧的时候,用户数据是最直接的选择。但它也是最危险的选择。

② “Agent 即数据源”这个模式,巨头迟早会跟进。

TikTok、Google Maps、Tesla Fleet Learning——都在各自领域验证过”用户使用产生数据,数据改进产品”的飞轮模式。AI Agent 只是把同样的逻辑搬到了新场景。

当 OpenAI 或 Anthropic 推出自己的版本时,模型优势 + 用户规模会让飞轮转得更快。

到那时候,谁先定义了标准,谁才有资格坐在牌桌上。

③ Hermes 赌的不是产品,是基础设施。

80 万个 SKILL.md 技能、Claude Code 和 OpenClaw 的兼容——这不是一个开源项目的体量。而如果你在 Agent 生态的早期就定义了”技能描述的标准格式”,你就占据了类似 Docker Hub 的位置。

这才是这个故事最值得思考的地方。


最后说一个细节

Nous Research 的代币还没有发行。

他们拿了 10 亿美元估值。投资方 Paradigm 是 crypto native 的。训练基础设施建在 Solana 上。代币经济学的细节从未公开。

Hermes Agent 是 MIT 协议,完全免费,不要钱。

但在这个故事的底层,有一家正在用免费产品获取数据、用开放标准锁定生态的 10 亿美元公司,等待着一个尚未发行的代币来完成最终的闭环。

这个故事到底该怎么评价?

说实话,我不确定。

但我确定的是,它是 2026 年开源 AI 领域最值得被看见的一次商业实验

你怎么看?欢迎在评论区聊聊。


本文基于 GitHub 源码及 Issues、Fortune 独家报道、Cointelegraph、Via News Frontier Paradox 分析、agent-native-scriptorium 技术分析、opc.community 英文评测、Teknium 个人网站、agentskills.io 规范文档等 20+ 来源交叉验证。数据截至 2026 年 4 月 15 日。