乐于分享
好东西不私藏

AI智能体开发日报 | 行业动态 | 2026年5月4日

AI智能体开发日报 | 行业动态 | 2026年5月4日

五一假期刚过,AI圈一点没消停。这周信息密度相当高——有人四个月烧光全年预算,有人8B参数干翻32B,还有人直接万亿参数开源白送。加上OpenClaw和Hermes Agent各自赶在节前发了新版,今天的周报我们逐个聊。


OpenClaw v2026.5.2:ChatGPT账号直登,两大编程生态合体

节前最后一天(5月2日),OpenClaw发布v2026.5.2正式版。这次没有花哨大功能,全在”稳定性和性能”上打磨,属于版本号看着平淡、实际体感提升明显的那种。

几个关键改动:外部插件安装统一收敛到npm生态,社区生态直接接上,写OpenClaw插件等于写npm包;Gateway和Agent热路径全面优化,覆盖startup、session、prompt预处理、插件加载等环节,高并发下体感差距会很明显;Control UI和WebChat修了一轮稳定性问题,Sessions、Cron、WebSocket、iOS PWA都做了加固;WhatsApp、Telegram、Discord、Slack、Signal六大平台的消息处理bug也清了一批。

但这周OpenClaw最大的新闻不是版本更新本身——是奥特曼宣布ChatGPT账号可以直接登录OpenClaw

两大编程生态,OpenAI的闭源商业生态和OpenClaw的开源社区生态,在这一刻正式合体。对OpenClaw用户来说,不需要单独配置API Key,用ChatGPT账号就能跑Agent workflow;对OpenAI来说,相当于把ChatGPT的能力出口扩展到了整个开源Agent社区。生态壁垒被拆了一块,对AI Agent开发者来说是实打实的利好。

Hermes Agent:视频理解来了,技能库能自己维护了

Hermes Agent在4月30日发布v0.12.0,代号”The Curator Release”,距上一个版本才一周。

核心卖点:自主Curator。Hermes Agent现在能自动给自己的技能库做”卫生”——按计划评估技能质量、清理过时内容、合并重复技能。以前装了一堆skill需要手动整理,现在Agent自己干了。这个”自我改进循环”的设计思路很有意思:Agent不仅能执行任务,还能维护自己执行任务的能力。

节后(5月3日)的commits同样值得关注:新增原生video_analyze工具,不再是”抽帧再用图片模型看”的曲线救国方案,对视频内容分析和短视频监控场景是实打实的能力升级。另外修了CLI工作目录bug(之前会忽略用户指定的terminal.cwd导致路径混乱)和debug日志脱敏问题(上传日志时部分敏感信息没遮住)。

小模型逆袭:IBM Granite 4.1,8B干翻32B

如果说这周AI圈有个共同主题,那就是”小模型正在蚕食大模型的领地”。

IBM发布Granite 4.1,仅8B参数,多项基准测试中匹配甚至超过32B MoE模型。8B是什么概念?一张消费级显卡能跑动的体量。两年前要达到同样效果,可能需要70B甚至更大的模型。

背后反映的趋势很明确:模型蒸馏和训练技术的进步速度,超过了单纯堆参数的收益曲线。对企业来说,部署成本直接降一个数量级,以前需要GPU集群跑的推理任务,现在一台服务器可能就搞定了。

小米MiMo-V2.5-Pro:万亿参数开源,还倒贴100万亿Token

和IBM走”小而精”路线形成鲜明对比的,是小米的MiMo-V2.5-Pro。

万亿参数MoE架构,100万token上下文窗口,开源。Artificial Analysis全球开源模型排行榜上与Kimi K2.6并列第一。放在一年前,万亿参数还是OpenAI和Google的专属俱乐部。

更猛的是配套的100万亿Token创作者激励计划(4月28日-5月28日)。用这些token训练的内容可接入Claude Code、Cursor等主流开发工具。小米在用”烧钱换生态”的策略,试图在开源大模型赛道建立自己的开发者社区。团队配置也很硬——平均年龄25岁,60%清北,55%博士。

从产品策略看,小米走的是”硬件+OS+AI模型”全栈路线。手机、汽车、IoT设备预装自研大模型形成数据飞轮,万亿参数开源更像一个技术品牌广告。

Uber的AI账单:四个月烧光全年预算

这周最让人警醒的新闻来自Uber。据报道,Uber在四个月内在Claude Code上花完了2026全年AI预算。接下来八个月要么削减使用,要么重新申请预算,要么换更便宜的方案。

Claude Code作为AI coding agent,单次成本看似不高,但团队规模和频率上去后,成本增长是指数级的。一个50人工程团队,每人每天100次代码补全和审查,月token消耗轻松达到数亿级别。这不是Uber独有的问题——越来越多企业发现效率提升带来的成本增长比预想中快得多。效率提升10%但成本增长200%,这笔账怎么算?

目前业内三种应对策略:内部token配额制、开源小模型分流(简单任务用便宜模型)、自建模型微调降低API依赖。Uber的案例提醒所有大规模部署AI工具的企业:AI工具的ROI不是自动正的,需要精算

OpenAI macOS供应链攻击

最后说一个安全事件。Axios的npm账户被疑似朝鲜黑客劫持,向npm包植入远程访问木马。OpenAI的macOS应用依赖了受影响的Axios版本,OpenAI的应对相当果断——轮换了全部macOS代码签名证书。5月8日后未更新的OpenAI macOS应用将无法启动,强制更新虽然粗暴,但在供应链攻击面前是最安全的做法。

这件事再次提醒开发者:npm生态的供应链安全是系统性风险,一个上游依赖被投毒,下游全受影响。锁定依赖版本、定期审计供应链、使用私有registry,这些看似无聊的安全实践比任何花哨功能都重要。


这周AI圈节奏紧凑。OpenClaw和Hermes Agent节前各交出扎实更新,ChatGPT账号直登OpenClaw把开源和闭源两大生态的边界又推了一步。小模型和大模型同时在各自赛道证明”参数量不是唯一答案”。Uber的预算失控则是个现实提醒——AI工具好用,但账单也会好看得到让人心跳加速。

下周见。