
AI 行业的竞争维度已经从「模型够不够强」切换到了「工程跑得够不够快」——过去 48 小时,Hermes Agent 两天连发三个版本、Anthropic 拿着 650 亿美元投后估值一举超越 OpenAI、中国大模型周调用量首次全面超过美国。这三件事看似无关,底层指向同一个信号:谁能在工程侧建立壁垒,谁就赢下下一阶段。
5 月 28 日到 29 日,Nous Research 的 Hermes Agent 像坐了火箭一样连发 v0.15.0、v0.15.1、v0.15.2 三个版本。这 173,630 Star 的开源 AI Agent 框架(MIT 协议,Python),这次更新堪称「工程效率大爆发」。
v0.15.0(代号 Velocity Release)是重头戏。从 v0.14.0 以来累积 1,302 次 commit、747 个合并 PR、1,746 个文件变更,数字本身就说明了迭代烈度。最核心的变化:那坨 16,083 行的 run_agent.py 被拆成 14 个 agent/* 模块,总行数压缩到 3,821,缩减 76%。这不是简单的代码整理,而是把单体架构切成了可独立维护的微模块,后续迭代速度会更快。
Kanban 系统从简单看板升级成了多 Agent 调度平台——支持 orchestrator 自动拆任务、swarm 拓扑结构、定时任务调度、per-task 模型选择。冷启动再砍一秒,单次对话 function call 减少 47%,hermes --version 在启动速度上直接跑赢了 Codex CLI。
session_search 做了底层重构,速度提升 4,500 倍,而且不再收费。安全方面新增了 Brainworm 级别的 Promptware 防御,Bitwarden Secrets Manager 接入后只需要一个 bootstrap token 就能替代几十个 API key。Skill bundles 让一条斜杠命令就能加载完整工作流。
v0.15.1 是当天发布的 hotfix,主要修复 v0.15.0 的 dashboard 无限重载 bug——在 Docker/loopback 模式下,401 响应被误判为 token 过期,导致页面疯狂刷新。v0.15.2 顺带修了插件 yaml 打包遗漏的问题。
对开发者来说,这次更新最实际的意义是:Hermes 正在从一个「能用的 Agent 框架」变成一个「好用的多 Agent 开发平台」。Kanban 的多 Agent 编排能力,加上 per-task 模型选择,意味着你可以针对不同子任务分配不同模型(简单任务用便宜模型,复杂任务用旗舰模型),成本和效果同时优化。

Anthropic 融 650 亿美元,估值 9,650 亿超越 OpenAI
5 月 28 日,Anthropic 宣布完成 650 亿美元 H 轮融资,投后估值飙升至 9,650 亿美元。这个数字直接超过 OpenAI 今年 3 月 8,520 亿美元的估值,让 Anthropic 成了全球估值最高的大模型初创公司。
钱到位的同时,产品也没闲着。Anthropic 同步发布了旗舰模型 Claude Opus 4.8,主打 Agentic Coding 能力大幅升级。Anthropic 的策略很清晰:用融资拿到更多算力产能,用更强的模型锁住开发者。
从行业格局看,Anthropic 的崛起不是孤例。整个 2026 年 5 月,全球 AI 大模型赛道迎来了几个关键转折点:OpenAI 和谷歌密集发布旗舰模型巩固技术壁垒,中国大模型在调用量上实现了历史性超越,各国政府开始加速 AI 基础设施投资。
中国大模型周调用量首次全面超越美国
这件事值得展开说。今年 2 月,在 OpenRouter 这个全球最大的 AI 模型 API 聚合平台上,中国模型的周调用量冲到 5.16 万亿次,3 周内增长 127%,首次全面超过美国模型。
背后是三个因素叠加:价格、开源策略和 Agent 生态。以 DeepSeek 为例,API 调用成本大约是 GPT-4 的十分之一,但实际效果差距已经小到可以忽略。中国 AI 公司普遍采用「低价高性能」策略,对全球数百万中小企业来说,这种性价比很难拒绝。加上中国模型大量走开源路线(DeepSeek、Qwen 等),社区生态的厚度在加速形成。
无问芯穹的大模型服务平台数据也印证了这个趋势——日均调用量在 3 月底增长到了 1 月初的 10 倍,部分顶尖模型甚至迎来百倍增长。从「能用」到「大规模用」,中国模型正在跨越那个关键门槛。

COMPUTEX 2026 即将开幕,AI PC 成主角
6 月 3 日,台北国际电脑展 COMPUTEX 2026 将正式开幕。这场创办 45 年的亚太最大 PC 产业盛会,今年的主题只有一个:AI PC。
戴尔已经提前行动了。5 月 27 日的春季新品品鉴会上,戴尔商用 PC 产品线全面换装 AI 算力——从旗舰笔记本到微型台式机,全部内置本地 AI 推理能力。Dell Pro Max GB300 这类产品不再只是「装了个系统的电脑」,而是专为本地处理计算负载设计的终端设备,给了企业一个不依赖公有云的切实选择。
GitHub Copilot 也在 5 月底完成了 2026 年度的全面升级,从代码补全工具进化成了自主 Agent——能在开发者授权下自主完成代码审查、bug 修复甚至 PR 提交。当 AI PC 端侧算力 + Copilot 自主化能力叠加,开发者日常工作的效率天花板会被再次推高。
OpenClaw 持续高强度迭代
顺带提一下 OpenClaw 本身。过去 48 小时,OpenClaw(375,663 Star,TypeScript)发布了一个正式版 v2026.5.28 和一个 beta 版 v2026.5.28-beta.4。
正式版的重点在稳定性:Agent 和 Codex 运行时的恢复机制更健壮了,子 Agent 的 cwd/workspace 分离更干净,session lock 在超时中断时能正确释放。消息通道安全性也做了大面积加固——Matrix、iMessage、Slack、Discord、WhatsApp、Telegram 等十几个消息平台的投递链路都修复了边界情况。移动端 iOS Pro UI、hosted push relay 默认开启、WebChat 重连机制等用户体验层面也有不少改进。
对开发者来说,OpenClaw 生态的持续高强度迭代意味着一个问题选择:如果想要极致的灵活性和多 Agent 编排能力,Hermes Agent 的 Kanban 平台是更成熟的选择;如果需要对接十几个消息平台和最大化的兼容性,OpenClaw 仍然是覆盖面最广的方案。
一句话:工程效率的军备竞赛已经打响,谁能让开发者少写一行配置、少踩一个坑、少等一秒启动,谁就占住了下一波红利。
夜雨聆风