
AI编程工具市场在一个月内完成了一次底层逻辑重写。五件事同向:谷歌删掉编辑器,Copilot砍掉无限补贴,Claude Code变成并行编排平台,Devin品牌重塑,Gemini CLI正式退场。更深层的变化是,竞争焦点正在从"谁的模型更强"转向"谁的Agent管理框架更稳"。这个叫Agent Harness的编排层,才是开发者下半年真正要解决的问题。
Hermes Agent连发修复补丁,稳定版进入日常打磨期
Hermes Agent目前GitHub Star数接近20万(199,885),Fork数超过3.5万,采用MIT协议。6月19日发布的v0.17.0代号"The Reach Release"(触达版),距离上个版本v0.16.0仅两周,却包含约1,475次提交、800多个合并PR、245位社区贡献者的代码。这个迭代密度在整个开源Agent框架领域排名靠前。
v0.17.0的核心新增能力围绕一个主题——"触达"。iMessage通过Photon的托管线路池接入,不再需要一台Mac当转发中继。Raft agent网络作为网关频道接入,让Hermes能被外部Agent网络唤醒执行任务,唤醒载荷只携带元数据不携带消息正文。桌面应用获得子智能体实时观察窗口、可重新绑定的键盘快捷键、原生系统通知、可直接安装VS Code Marketplace主题。子智能体现在支持后台运行,图片生成增加了编辑能力。
发布之后,开发团队立刻进入密集修复阶段。6月22日一天就推送了至少7个修复提交。Discord的斜杠命令在应用累计超过100条后会触发硬限制,新版本在创建新命令前自动清理过期命令。Cron定时任务的max-iteration兜底报告此前可能丢失,现在确保送达。Agent在收尾轮次可能截断最终文本的问题被修复。
Computer Use的安装逻辑移除了损坏的预检探测,改为信任上游安装程序。图片和视频生成的Schema传递指令改为平台中立格式。API层面的Dashboard更新在容器环境中使用Git检出时的兼容性问题也被解决。
这些修复看起来琐碎,但恰恰是Agent在真实环境中长期运行最容易出问题的地方。稳定版进入"日常打磨"阶段,说明框架已经从演示阶段跨入生产阶段——不是加新功能,而是把已有功能跑稳。

AI编程工具一个月内五件大事,底层逻辑被重写
2026年5月到6月,AI编程工具市场在一个月内发生了五件互相串联的大事。这不是各自独立的产品迭代,而是一次从底层逻辑上改变游戏规则的集中洗牌。
5月19日,谷歌在I/O大会上发布Antigravity 2.0,做了一件让所有人意外的事——它直接删掉了代码编辑器。Antigravity 1.0是VS Code的fork,一个加了AI的编辑器。2.0版本不是弱化编辑器,是物理删除。产品形态从"AI增强的编辑器"变成了纯粹的Agent任务执行界面。谷歌的判断很明确:开发者不再需要手动看代码,他们只需要描述任务,让Agent去完成。
5月28日,Claude Code发布v2.1.154,带来Dynamic Workflows功能。给一个大任务,Claude Code自动拆分成多个子任务,启动多个Agent并行执行。实测数据显示10到20个并行Agent表现稳定,超过30个开始出现明显的协调开销。默认模型升级为Opus 4.8。Claude Code正在从一个终端里的编码助手变成一个任务编排平台。
6月1日,GitHub Copilot的计费模式从"Premium Requests"切换为"AI Credits"。社区立刻炸锅,有用户报告"一天就用完了一个月的额度"。Simon Willison做了一组实测:重度用户使用Claude Code加Codex的月均API Token消耗,按API公开价格折算后,与订阅费的差距超过10倍。Copilot拥有比Claude Code大得多的用户基数,几百万用户每人每月消耗价值两千多美元的算力,却只收10到40美元。AI Credits模式就是GitHub在止血——补贴烧不起了。
6月2日,Devin品牌重塑,将本地和云端统一为一个产品线。6月18日,Gemini CLI正式退场,用户被迁移到Antigravity。一个时代的标志性工具被官方关停,而替代它的不是另一个CLI,是一个没有编辑器的Agent平台。
五件事拼在一起,指向同一个判断:AI编程工具的竞争已经不在"代码补全谁更准"这个层面了。编辑器可以被删除,无限补贴可以被砍掉,单一CLI可以被关停。留下来的形态只有一种——Agent编排平台。

Agent Harness才是下半年真正的内卷核心
当模型能力越来越接近天花板,开发者的痛点和模型供应商的卖点终于出现了分歧。模型供应商还在卷参数、卷上下文窗口、卷评测分数。但真正在用Agent做项目的人,遇到的瓶颈几乎从来不是"模型不够聪明"。
这个瓶颈有一个名字——Agent Harness(智能体管理框架)。它指的是包裹在大模型外层的那套工程系统:任务分解、工具调度、错误恢复、状态保持、权限控制、多智能体协调。模型只是引擎,Harness是底盘、传动和刹车。引擎再强,底盘散架,车还是开不动。
用一个具体场景说明。你让一个Agent去做一个复杂的软件重构任务:分析代码库、制定修改方案、拆分成子任务、逐个执行、测试验证、提交PR。模型回答单个问题的能力可能很强,但整个任务链条涉及几十次工具调用、多次状态转换、可能的失败重试、子任务之间的依赖管理。
任何一环出错——工具超时、上下文被截断、子任务顺序混乱、权限校验失败——整个任务就崩了。
这正是Hermes Agent v0.17.0发布后密集修复的问题类型。Cron兜底报告的送达保证、子智能体的后台运行和状态恢复、消息通道的格式一致性、容器环境中的兼容性。这些都不是模型层面的能力问题,而是Harness层面的工程问题。
有一个数据可以佐证这个趋势的紧迫性。91%的企业在部署AI Agent时踩过权限漏洞的坑,业界已经记录了至少54起Agent失控事件。这些失控几乎全部发生在Harness层面而非模型层面——Agent被给了过大的权限、没有合理的工具策略边界、错误处理链路不完整。
这解释了为什么2026年下半年Agent基础设施赛道会加速整合。谁的Harness更稳定、谁的错误恢复机制更完善、谁的多渠道部署更统一,谁就能在模型趋同的背景下留住开发者。模型可以随时切换——从Claude到GLM到GPT——但换掉一个不稳定的Harness,所有自动化任务链路都得重新调试。
Hermes Agent选择的路子是开源加多渠道。MIT协议、200k Star的社区、iMessage和Raft等新渠道的接入、子智能体后台运行和状态恢复机制的完善——这些都是在给Harness加厚度。Cursor被600亿美元收购的故事证明了Agent工具入口的价值,但也同时说明:一旦入口被巨头垄断,依赖它的开发者就失去了议价权。开源Harness的价值正在于此——它不被任何巨头拥有。
对开发者来说,今天最务实的判断是:别只盯着模型评测榜了。选一个Harness靠谱、可以自主控制、社区活跃的Agent框架,比选一个跑分高2%的模型更重要。模型半年换一代,Harness换了要重跑所有任务链路。
夜雨聆风