2026年4月23日AI日报 | 小米连发四款大模型,Agent 战场再掀开源风暴

1. 小米发布 MiMo-V2.5 系列四款模型,两款即将开源
小米宣布开启 MiMo-V2.5 系列大模型公测,包含 V2.5、V2.5-Pro、V2.5-TTS Series 及 V2.5-ASR 四款。其中 V2.5-Pro 定位复杂长程 Agent 任务,官方称其在通用智能体能力和软件工程维度已媲美 Claude Opus 4.6 及 GPT-5.4;V2.5 为原生全模态模型,能同时处理视觉、听觉与文本信息。MiMo-V2.5 和 V2.5-Pro 即将开源。
-
V2.5-Pro 可稳定完成近千轮工具调用的长程专业任务,支持复杂软件工程场景
-
V2.5 原生全模态+成本优势:以约一半 API 成本超越上一代 V2.2-Pro 智能体性能
-
即将开源的两款模型预计将进一步降低 Agent 开发门槛
2. Meta 推出即时测试方法,AI 辅助开发缺陷检测能力提升 4 倍
Meta 在代码评审期间引入即时测试方法,替代传统需要长期维护的测试套件。该方法基于代码差异动态生成有针对性测试,在 AI 辅助开发环境中将缺陷检测能力提升约 4 倍,检测有意义失败最高提升 20 倍。
-
核心技术结合大语言模型、程序分析和变异测试(注入合成缺陷验证测试有效性)
-
关键组件包括 Dodgy Diff 与意图感知工作流架构,将代码变更重新定义为语义信号
-
评估基于超过 22,000 个生成测试,适用于 Agent 工作流代码生成量大的场景
3. Qwen 团队开源 Qwen3.6-27B,编程能力超越前代旗舰
阿里 Qwen 团队发布 270 亿参数开源稠密模型 Qwen3.6-27B,原生支持多模态及思考模式。其编程能力在所有主要基准上全面超越前代开源旗舰 Qwen3.5-397B-A17B,权重已在 Hugging Face 和 ModelScope 开放。
-
270 亿参数规模兼顾性能与部署成本,适合私有化落地场景
-
编程能力全面超越此前参数量更大的旗舰模型,开源密度提升
-
用户可通过 Qwen Studio 或阿里云百炼 API 直接调用
4. Claude Code ultrareview 功能上线,Pro/Max 用户免费 3 次
Claude 官方宣布 Claude Code 的 /ultrareview 代码审查功能面向 Pro 和 Max 用户提供截止 5 月 5 日的 3 次免费使用机会。该功能通过云端多 Agent 并行审查代码,自动将结果反馈至 CLI 或 Desktop 客户端。
-
审查在云端运行,不占用本地资源,适合快速 Review 大型代码库
-
5 月 5 日前有效,额度有限
5. 商汤绝影发布端侧大模型 Sage,32B 参数激活 3B 超越云端旗舰
商汤绝影推出端侧多模态大模型 Sage,总参 32B、激活仅 3B,将云端级智能体能力落地端侧。Sage 在 Agent 评测基准 PinchBench 上超越 Claude Opus 4.6 及 GPT-5.4,已在英伟达 Orin 实现部署,核心技术包括 SCOUT 分级协同学习与 ERL 可擦除强化学习。
-
32B 总参/3B 激活参数设计,解决端侧设备算力限制与智能化不足的矛盾
-
SCOUT 框架将”探路”与”学习”解耦,ERL 支持模型主动识别并原地修正推理错误
-
北京车展期间将推出搭载 Sage 的 SageBox 硬件,实现车载系统联动
6. Zed 推出 Parallel Agents,支持多 Agent 并行编排
Zed 编辑器发布 Parallel Agents 功能,允许用户在单一窗口内并行运行和编排多个 Agent,通过 Threads Sidebar 集中管理,支持按项目分组、跨仓库读写、按线程组合不同 Agent 及按需隔离工作树。
-
针对 Agent 工作流优化了默认面板布局,macOS/Windows/Linux 全平台支持
-
开发者可组合多个 Agent 同时处理不同任务,提升复杂项目开发效率
7. Hermes Agent 限时免费开放 Kimi K2.6 和 Step 3.5 Flash
Hermes Agent 宣布在 Nous Portal 上限时免费提供 Kimi K2.6(未来 24 小时)和 Step 3.5 Flash(10 天内)。用户可通过执行 hermes update 后在 hermes model 中选择对应模型名称配置使用。
-
Kimi K2.6 由 Vercel AI Gateway 和 Moonshot 提供支持,24 小时限时
-
Step 3.5 Flash 由 StepFun AI 支持,10 天窗口期
8. OpenAI 在 ChatGPT 上线 Workspace agents,企业可共享与定时执行 Agent
OpenAI 面向 Business/Enterprise/Edu 订阅推出 ChatGPT Workspace agents 功能,团队可构建特定能力 Agent 并在工作区内共享,支持按计划自动执行重复任务,Agent 可跨文档、邮件、Slack、Linear 等工具运行,管理员可通过集中控制台进行权限和审计管理。
-
跨工具自动化能力覆盖企业常见工作流,减少人工重复操作
-
管理员享有集中控制台,支持基于角色的访问控制与人工审批门禁
-
适合销售、IT 等多部门团队构建专属自动化 Agent
9. Google 推出 Gemini Enterprise Agent Platform,统一企业 AI 技术栈
Google 发布 Gemini Enterprise Agent Platform,帮助技术团队大规模构建和管理 AI Agent,同时让业务人员零代码使用和创建智能体。平台底层集成 Vertex AI,支持 Gemini 3.1 Pro/Flash Image、Lyria 3 及 Claude Opus 4.7 等多模型,与全员版 Gemini Enterprise App 深度集成。
-
统一平台降低企业 Agent 开发与治理门槛,IT 建能力、业务直接用
-
多模型支持避免单一模型供应商锁定,Claude 4.7 首次纳入 Google 平台
10. Google Workspace Intelligence 全面上线,Gemini 赋能 Docs 和 Sheets
Google 宣布 Workspace Intelligence 面向所有 Workspace 客户及 AI Ultra/Pro 用户全面开放。通过整合 Gmail、Calendar、Chat、Drive 数据,为 Docs 提供智能写作与风格模仿,为 Sheets 提供自动构建表格和智能填充。
-
文档和数据表格层面全面接入 Gemini,企业办公工作流自动化再进一步
-
所有 Workspace 客户均可使用,无需额外付费或申请
声明:本内容由AI生成,可能包含不准确或推测性信息,请读者自行甄别并谨慎参考。
欢迎点赞收藏


夜雨聆风