先扔个扎心的结论:
AI Agent这场牌局打到最后,比的不是谁的模型高考能考700分,是谁的工资低、不交房租还能24小时全天候待命,不喊累、不摸鱼、不跟你要股权。
最近我把一个在GitHub上发疯的开源项目扒了个精光——Hermes Agent。这名字一听就是奢侈品,但偏偏走的是拼多多的路子。Nous Research做的,2月底开源,不到两个月就蹿到5万多星(截至4月11日已超5.2万星)。这个涨粉速度,多少砸了几百万做宣发的大厂项目看了都得沉默。
一边是开源框架零成本跑路,另一边呢?国内云厂商今年4月集体调高AI算力价格。
腾讯云更狠——一个月内涨了两次:3月11日先把混元HY2.0 Instruct模型输入价格从0.0008元/千tokens拉到0.004505元/千tokens,涨幅463%;4月9日又把AI算力相关产品服务费上调5%。
小米MiMo订阅套餐直接锚定Claude同档定价。
开源帮你省钱,云厂商想从你兜里多掏钱——这一进一出,差距就拉开了。
有人说它是OpenClaw(江湖人称“龙虾”)的平替。有人说是Agent赛道的下一只“巨兽”。
我用了几天,又把代码仓库翻了个底朝天。结论是:这玩意儿不是在做更聪明的Agent,它是在重新定义AI打工人的KPI考核标准。
01
5万颗星背后:
开发者用脚投的票,比任何PPT都诚实
2月底开源首月破2.2万星,4月8日v0.8.0版本一发布,单日新增6400多星。多日霸榜全球开源榜单第一。
这什么概念?同期很多砸钱做宣发的大厂开源项目,被它甩了几条街。
但真正让我半夜睡不着的,是社区里那些声音。
有个开发者在X上直言:“我准备放弃龙虾转爱马仕了,龙虾记忆太差了,爱马仕无论怎么重开,过多久都能记住,太香了!”
谷歌高级AI产品经理Shubham Saboo公开点赞。小米大模型MiMo直接官宣接入,限免两周。
最让我头皮发麻的是这条:X上有人提到,他们的Hermes Agent会自主给商业伙伴的Hermes Agent发消息,协同完成某项任务,全程没有人工介入。
Agent跟Agent自己聊上了。科幻片里的场景,现在花一杯咖啡的钱就能跑起来。
但上面这些,都还不是我要讲的重点。重点藏在一个开源仪表盘里。
02
一笔账算下来,谁算谁沉默
社区里有个哥们做了一件我非常佩服的事。他写了个开源仪表盘,专门分析每次API调用的Token消耗结构。
结果是:每次调用里,一大半Token都花在了“自我介绍”上。工具定义占46%,system prompt占27%。真正干活的算力,不到三成。
翻译成人话:你每次让Agent干活,一大半钱都花在了“告诉它你是谁、它有哪些家伙什”上。活还没开始干,钱先烧了一大截。
OpenClaw的问题更狠。小米大模型负责人罗福莉4月初写过一篇技术复盘,把这个问题扒了个精光:OpenClaw一次用户查询常被拆分成多轮低价值工具调用,每次API请求携带超过10万Token的上下文窗口。
她的原话更直接——“OpenClaw这类工具像是一个没有经过工程优化的原型车,每公里的油耗是正常车辆的十倍。”
打一个你能秒懂的比方:
你请了个实习生,每次让他干活前,你得花半小时重新介绍公司架构、部门分工、他能用什么工具。好不容易听明白了,活干完,第二天全忘光。明天还得再来一遍。而且这个实习生每隔30分钟就主动来问一句“老板,有新活吗”,每次问都要收费。
这哪是生产力工具?这分明是碎钞机。
而且这个碎钞机还在涨价。国内云服务三巨头阿里云、腾讯云、百度智能云4月集体调高算力价格。腾讯云更是一月涨两次——模型API先涨463%,AI算力再涨5%。Token从“厘”计价的时代正在结束——从2024年的价格战到2026年的涨价潮,两年内彻底反转。
那Hermes怎么做的?
它内置了一套学习循环——每次执行完任务,自动把成功的操作经验提炼成Skill插件存到本地。下次遇到类似的活,直接调取,不用重新加载全部工具定义。而且它回归了单Agent架构,没有编排层,没有多Agent集群。OpenClaw围绕多Agent编排来设计——多Agent编排意味着更多轮次的API调用、更复杂的上下文管理、更高的Token消耗。单Agent架构把这些复杂度收敛进了学习循环本身。
配合Ollama本地推理,一台5美元的VPS就能24小时待命,API调用成本几乎为零。
5美元养一个全天候AI打工人。隔壁OpenClaw跑一个复杂会话,有团队五个人共享一个实例,第一个月预期成本100美元,实际账单接近800美元。
这个账,谁算谁沉默。
Gartner预测,到2026年底,40%的企业应用将包含任务专用AI Agent。但同样来自Gartner的另一个预测是:超过40%的Agent项目将在2027年前因成本上升、商业价值不明或风险控制不足而取消。
两个40%搁在一起看,结论很清晰:Agent会普及,但只有成本管得住的那批能活下来。
03
别把Hermes当OpenClaw的“平替”,
这属于偷懒式理解
拿张纸画一下这俩的底层逻辑:
❙ OpenClaw:
用户输入 → 加载所有工具定义 → 模型决策 → 执行 → 结束。什么都没留下。
❙ Hermes:
用户输入 → 只加载相关Skill → 模型决策 → 执行 → 自动提炼Skill存起来。越用越强。
一句话说清楚:OpenClaw是瑞士军刀,功能多;Hermes是会记笔记的实习生,脑子好。
有人问“哪个更适合本地模型”?
一个挺到位的说法是:Hermes更适合作为本地模型驱动的、会自我成长的核心大脑;OpenClaw更适合作为连接本地模型与海量外部工具的万能接口。
所以别把Hermes当平替,它俩走的是两条路。
也是在这一轮对比中,我注意到一个被很多人忽略的技术细节:单Agent架构 vs 多Agent编排。表面上是技术路线的差异,底子里是两种完全不同的商业算账方式——多Agent编排意味着更多轮次的API调用、更复杂的上下文管理、更高的Token消耗。单Agent架构把这些复杂度收敛进了学习循环本身。
04
产业终局推演:
Agent正在分岔,中间地带最危险
写到这,我得把话说透。
Hermes再好,目前也只是个v0.8.0的开源项目,离1.0还有距离。它的Skill自动提炼能力在确定性场景表现良好,但在高复杂度、多分支决策任务中仍需人工介入。它主攻的是个人助理、本地自动化,不是企业级协同。
但它的爆火释放了一个我盯了很久的信号:Agent产业正在两极分化。
一边是“轻量化个人Agent”(Hermes代表):本地部署、5美元VPS、强调隐私和成本效率。
一边是“企业级多Agent系统”:云端部署、按席位计费、强调合规和协同编排。
中间地带的“通用Agent平台”会非常难受。往上,干不过有行业Know-how的老炮;往下,卷不过开源社区的极致降本。
这也是为什么Nous Research不只是做一个Agent,而是在搭一整条生态:推出了agentskills.io开放技能标准,社区已经长出了HermesHub、mission-control等多Agent管理面板。
这套打法,像极了当年的WordPress——核心开源免费,靠插件生态和托管服务赚钱。
05
平头哥锐评
说实话,写完这套拆解,我有点感慨。
过去两年AI圈一直在卷模型参数。你700亿,我1300亿,他4000亿,谁都觉得自己家的孩子最聪明。
Hermes用5万多颗星狠狠打了这个逻辑的脸。
真正的商业创新,往往藏在那些“不起眼但极其烧钱”的细节里。大厂的产品经理会看到Token被浪费的问题吗?看到了会优先解决吗?大概率不会。因为大厂的KPI是“模型能力碾压友商”,不是“帮用户省API钱”。
但这恰恰是用户最真实的痛点。
我当年做项目的时候,为了省API费用,让实习生人肉盯着看门狗,一个月省了三万块。现在Hermes直接把这活干成了自动化。这种“原来可以这样省钱”的时刻,才是技术真正落地的时候。
商业的终局,永远是效率的胜利。
06
平头哥三板斧
第一斧:扒底牌
Hermes去掉所有包装,底层逻辑就一句话:用学习循环把每次API调用的固定成本压到最低,同时让Agent越用越懂你。
第二斧:算总账
最低成本:一台5美元/月的VPS + Ollama开源模型 = 几乎零API调用成本(硬件和电费另算)。最大风险:项目还在v0.8.0,生产环境稳定性待验证,本地模型和闭源模型还有差距。
第三斧:抄作业
今晚就在本地装个Ollama,拉一个Qwen 3.5-35B,跑一遍Hermes的Quick Start。如果显存不够,先从7B模型试起。感受一下“零成本AI助理”是什么体验。5块钱的VPS明天再买,这第一步今晚就能走。
我知道,看完这篇文章一定有人骂我:“平头哥你太偏激了!OpenClaw的生态广度才是未来!”
没关系。我从来不指望讨好所有人。
我坚持我的判断:未来18个月,Agent赛道的核心竞争维度将从“模型能力”转向“成本效率”。 谁能用更少的Token干同样的活,谁就能吃掉最大的用户增量。
如果你也被OpenClaw烧过钱,评论区聊聊——你一个月喂了多少Token给这只龙虾?
评论区,等你来战。
夜雨聆风