一个名叫Hermes(昵称:爱马仕)的开源Agent,以单日消耗2710亿(271B)Token的恐怖用量,瞬间超越了长期霸榜的“龙虾”(OpenClaw),强势登顶OpenRouter全球应用调用量总榜第一。

在这个被称为“AI界真实用量晴雨表”的平台上,Hermes这次的“屠杀式”登顶,让全行业意识到:当大家还在争论谁的模型聊天更逼真时,能够自主执行任务的智能体(Agent),已经在悄无声息中接管了世界。
⚡ 2710亿Token的降维打击:重新定义“高频应用”

这不是一次微弱的超越,而是一场对旧时代的横扫。
OpenRouter最新的Token消耗榜显示,Hermes Agent的单日消耗量达到271B(2710亿Token)。紧随其后的OpenClaw日耗为245B Token,代码工具Kilo Code为149B Token,就连此前在程序员圈爆火的Claude Code也仅有79.2B Token。
这不仅仅是数字的超越。
更让人后背发凉的是,Hermes的累计Token消耗量已经突破6.37万亿。这意味着这个能够自主进化的智能体,已经深深嵌入到了数以万计开发者的真实开发流水中。
榜单前四强中,有三个都是具备复杂任务规划和执行能力的Agent—CLI编程工具,唯独没有纯粹的聊天机器人。这标志着,开发者对AI的需求已经从“你问我答”的浅层交互,彻底转向了“帮我把活干了”的自动化狂潮。
回顾4月中旬,Hermes仅仅是在OpenRouter的“最热门编程Agent”细分榜单上初露锋芒,挤下OpenClaw成为第一。谁能料到,短短不到一个月,它就在最为庞大和核心的总用量榜上完成了反杀。
🔍 为什么是现在?Token消耗的“信号弹”宣告Agent时代全面来临
5月10日,券商的研报清晰地划出了一条分界线:AI产业正在从“聊天机器人时代”急速奔向“智能体(Agent)时代”。
高盛分析师团队给出了极其惊人的预测节奏:
到2030年,全球Token消耗量将较2026年水平疯狂暴增24倍,达到每月约120千万亿的恐怖级别。

仅仅在一年前,我们提到AI应用,脑海中浮现的还是用自然语言提问、让大模型写文案。但到了2026年的5月,像Hermes这样的Agent每周消耗的万亿级Token,早已不再是靠人类的十根手指在键盘上的对话输入。
高盛特别指出,传统聊天机器人单次对话大约只消耗1000个Token,而一个处于“持续在线”状态的智能体,每天的Token消耗量可能直接飙升至10万个以上。面对无止境的真实物理世界任务,Agent 24小时不停地在监控环境、调动软件工具、重试验证——这根本就是一场单方面的效率屠杀。
Token的激增背后,是AI与物理世界、软件世界的交互实现了几何倍数的跃迁。
🚀 14万星开源杀器:带着“记忆”与“进化”改变格局

Hermes凭什么能杀出重围?
答案藏在其异常恐怖的底层“体质”里。
Hermes Agent由Nous Research倾力打造,是一款完全开源自进化的智能体。在技术论坛里,开发者们给它起了一个响当当的外号——“越用越聪明”的Agent。
与市面上很多仍停留在短效记忆的竞品相比,Hermes不仅具备持久且精准的回忆能力,还内置了完整的自我学习机制。它一边在运行中承接过滤任务,一边自我反思并自主创建、优化操作技能。这种像“滚雪球”一样的智能提升模式,使得它接管的编程、数据分析与云端部署任务越来越高效。
仅仅一个多月,Hermes在GitHub上的星标数就实现了翻倍暴涨,直冲14万,Fork数突破21.8k。
在社区的极速传播下,小米的MiMo-V2-Pro、以及MiniMax、英伟达Nemotron、阶跃星辰、腾讯混元等大厂的顶级开源模型,纷纷宣布成为支撑Hermes运行的第一贡献核心模型。当你看到如此多元的云端模型都在为同一个应用源源不断地供血,你就知道它的生态护城河有多宽。
🌊 当Agent开始“蚕食”软件业,你的工作流还安全吗?
Hermes的登顶以及同期Agent赛道的全面爆发,正在撕碎旧有的软件护城河。
在这份全球榜单中,代码自动化与AI代理工具占据了绝对统治地位。从Claude Code到CodeBuddy,传统的代码助手正目睹自己的边界被通用智能体无情侵蚀。
就在刚刚过去的5月7日,腾讯混元公布了一组堪称炸裂的数据:在代码和智能体类场景里,其新一代模型在腾讯WorkBuddy/CodeBuddy以及QClaw等应用中,Token调用量的增幅一下子超过了16.5倍。字节的Agent应用CodeBuddy同样踏上了这条爆发路径。
智东西在今天的分析中一针见血地指出:在App Store和网页应用的形态下,过去的SaaS(软件即服务)大厂靠流程、权限、数据和组织架构筑起高墙壁垒。但在未来,这些都将不堪一击。
未来AI驱动的Agent将会靠“懂你”和“会干活”来建立全新的统治级壁垒。

想象一下,管理者在聊天框发送一句“把上个季度的物流数据拉出来,用财务模型跑一下,做成PPT发给相关部门并抄送我”,一个7天×24小时的Agent就能在秒级别自主完成链路规划、接口调用、代码验证乃至最终的邮件分发。
能自己解决问题、长久陪伴你干活的生产力神器,远比一个只会聊天弹窗的对话框更具用户粘性和不可替代性。
💡 回归冷静:开源Agent离“王座”还有几道坎?

我们需要承认,从单日Token消耗量大爆发,到Agent真正成为万物互联时代的水电煤,中间尚有几道难啃的硬骨头。
271B的日Token消耗固然让人心潮澎湃,但这也意味着推理成本极高。目前,Agent要在稳定性、封闭安全性、Token成本和庞杂的生态协同这几大边界上找到完美的平衡。
正如业内的精辟总结:Agent要成为重构人类生产力的基础设施,不能只会“猛烧Token,大力出奇迹”,它还得在一次性任务成功率、响应速度、多模态推理能力之间找到最优解。
🎯 写在最后
2026年5月9日,许多人或许只是当作普通的一天。
但在全球开发者的后台,Token消耗量的巨幅波动宣告了一个旧时代的落幕与新时代的开启:AI的主赛道,正式从“谁更能聊”,切换到了“谁更能干”。
高盛等机构笃定,到2030年企业级智能体将推动全球Token消耗飙升24倍。当Hermes、OpenClaw这些开源的先行者用实打实的耗能数字正面向闭源产品和传统软件发起正面挑战,这一刻,不仅是AI应用层的牌桌重洗,更是下一个十年科技权力的交接。
我们正处于这样一个奇点前夜——你不再需要自己来指挥鼠标与键盘去操作复杂的专业软件,你只需要发号施令,一支永不疲倦的数字劳军团,已经在此刻,正式踏上了撼动整个软件世界的征途。

夜雨聆风