2026年5月12日AI日报 | 多家巨头同日更新,AI Agent 与多模态成两大主线

AI日报

2026.5.12日资讯速递

1. Claude Code 上线 Agent view，并新增 /goal 指令

Anthropic 为 Claude Code 推出研究预览功能 Agent view，试图解决并行 Agent 使用时要频繁切换终端标签、tmux 窗格的痛点。用户现在可通过 claude agents 在单一界面查看多个会话状态，并直接回复或转后台处理。

Thinking Machines Lab 公布 Interaction Models 研究预览，核心是一个原生面向实时、多模态协作的模型 TML-Interaction-Small。它希望突破传统大模型“你一句我一句”的回合制限制，让模型能持续处理音频、视频、文本流并实时响应。

OpenBMB 发布并开源 1.3B 参数多模态模型 MiniCPM-V 4.6，主打低算力、低 token 消耗、可直接跑在手机端。官方称其在多项基准上超过 Qwen3.5-0.8B，适合消费级硬件和移动端部署。

Anthropic 宣布 Claude Platform on AWS 正式可用，AWS 客户可直接用现有 IAM 身份与统一账单接入完整 Claude 原生 API。这个服务强调“入口在 AWS，平台由 Anthropic 运营”，与 Bedrock 的模式并不相同。

OpenAI Developers 宣布，Codex 已可通过官方插件更快调用 OpenAI APIs，帮助开发者构建 AI 应用和 Agent。这说明 Codex 正在进一步向“开发工作流入口”延伸，而不只是代码补全工具。

阿里宣布淘宝“AI低价帮抢”已接入支付宝“AI付”，同时千问 App 与淘宝全面打通，用户可以直接在千问里选商品、比价并完成下单。AI 助手开始从“推荐”走向“交易闭环”。

Artificial Analysis 推出 Coding Agent Index，评测的是“模型 + 编程工具”组合在真实软件工程任务里的综合表现。这个方向比单纯测模型能力更贴近企业实际采购和团队选型。

小米大模型应用团队发布 SVOR（稳定视频物体消除）框架，针对真实视频场景里物体移除后常见的阴影残留、遮罩粗糙、时序闪烁等问题做优化。相比只在理想条件下有效的方法，SVOR更强调真实世界可用性。

Codex 的 GitHub 仓库近期被发现新增“Ultrafast Mode（超快模式）”相关内容，主打低延迟场景下的最快响应。不过该信息随后被删除，当前仍处于未正式确认状态。

据相关报道，Anthropic 的 Claude Mythos Preview 在 METR 测试中已触及现有评测框架上限，显示其在超长链路任务上的能力持续增强。核心信号是，模型可以在“人类需 16 小时完成”的复杂任务上达到 50% 成功率。

声明：本内容由AI生成，可能包含不准确或推测性信息，请读者自行甄别并谨慎参考。

欢迎点赞收藏

持续关注每日AI前沿动态

- 立即扫码 -

更多资讯，

点击下方卡片关注赛凡智云协作平台

▲ 赛凡云盒，一款超好用的企业私有云盘