2026年4月23日AI日报 | 小米连发四款大模型,Agent 战场再掀开源风暴-夜雨聆风

2026年4月23日AI日报 | 小米连发四款大模型,Agent 战场再掀开源风暴

AI日报

2026.4.23日资讯速递

1. 小米发布 MiMo-V2.5 系列四款模型，两款即将开源

小米宣布开启 MiMo-V2.5 系列大模型公测，包含 V2.5、V2.5-Pro、V2.5-TTS Series 及 V2.5-ASR 四款。其中 V2.5-Pro 定位复杂长程 Agent 任务，官方称其在通用智能体能力和软件工程维度已媲美 Claude Opus 4.6 及 GPT-5.4；V2.5 为原生全模态模型，能同时处理视觉、听觉与文本信息。MiMo-V2.5 和 V2.5-Pro 即将开源。

V2.5-Pro 可稳定完成近千轮工具调用的长程专业任务，支持复杂软件工程场景
V2.5 原生全模态+成本优势：以约一半 API 成本超越上一代 V2.2-Pro 智能体性能
即将开源的两款模型预计将进一步降低 Agent 开发门槛

2. Meta 推出即时测试方法，AI 辅助开发缺陷检测能力提升 4 倍

Meta 在代码评审期间引入即时测试方法，替代传统需要长期维护的测试套件。该方法基于代码差异动态生成有针对性测试，在 AI 辅助开发环境中将缺陷检测能力提升约 4 倍，检测有意义失败最高提升 20 倍。

核心技术结合大语言模型、程序分析和变异测试（注入合成缺陷验证测试有效性）
关键组件包括 Dodgy Diff 与意图感知工作流架构，将代码变更重新定义为语义信号
评估基于超过 22,000 个生成测试，适用于 Agent 工作流代码生成量大的场景

3. Qwen 团队开源 Qwen3.6-27B，编程能力超越前代旗舰

阿里 Qwen 团队发布 270 亿参数开源稠密模型 Qwen3.6-27B，原生支持多模态及思考模式。其编程能力在所有主要基准上全面超越前代开源旗舰 Qwen3.5-397B-A17B，权重已在 Hugging Face 和 ModelScope 开放。

270 亿参数规模兼顾性能与部署成本，适合私有化落地场景
编程能力全面超越此前参数量更大的旗舰模型，开源密度提升
用户可通过 Qwen Studio 或阿里云百炼 API 直接调用

4. Claude Code ultrareview 功能上线，Pro/Max 用户免费 3 次

Claude 官方宣布 Claude Code 的 /ultrareview 代码审查功能面向 Pro 和 Max 用户提供截止 5 月 5 日的 3 次免费使用机会。该功能通过云端多 Agent 并行审查代码，自动将结果反馈至 CLI 或 Desktop 客户端。

审查在云端运行，不占用本地资源，适合快速 Review 大型代码库
5 月 5 日前有效，额度有限

5. 商汤绝影发布端侧大模型 Sage，32B 参数激活 3B 超越云端旗舰

商汤绝影推出端侧多模态大模型 Sage，总参 32B、激活仅 3B，将云端级智能体能力落地端侧。Sage 在 Agent 评测基准 PinchBench 上超越 Claude Opus 4.6 及 GPT-5.4，已在英伟达 Orin 实现部署，核心技术包括 SCOUT 分级协同学习与 ERL 可擦除强化学习。

32B 总参/3B 激活参数设计，解决端侧设备算力限制与智能化不足的矛盾
SCOUT 框架将”探路”与”学习”解耦，ERL 支持模型主动识别并原地修正推理错误
北京车展期间将推出搭载 Sage 的 SageBox 硬件，实现车载系统联动

6. Zed 推出 Parallel Agents，支持多 Agent 并行编排

Zed 编辑器发布 Parallel Agents 功能，允许用户在单一窗口内并行运行和编排多个 Agent，通过 Threads Sidebar 集中管理，支持按项目分组、跨仓库读写、按线程组合不同 Agent 及按需隔离工作树。

针对 Agent 工作流优化了默认面板布局，macOS/Windows/Linux 全平台支持
开发者可组合多个 Agent 同时处理不同任务，提升复杂项目开发效率

7. Hermes Agent 限时免费开放 Kimi K2.6 和 Step 3.5 Flash

Hermes Agent 宣布在 Nous Portal 上限时免费提供 Kimi K2.6（未来 24 小时）和 Step 3.5 Flash（10 天内）。用户可通过执行 hermes update 后在 hermes model 中选择对应模型名称配置使用。

Kimi K2.6 由 Vercel AI Gateway 和 Moonshot 提供支持，24 小时限时
Step 3.5 Flash 由 StepFun AI 支持，10 天窗口期

8. OpenAI 在 ChatGPT 上线 Workspace agents，企业可共享与定时执行 Agent

OpenAI 面向 Business/Enterprise/Edu 订阅推出 ChatGPT Workspace agents 功能，团队可构建特定能力 Agent 并在工作区内共享，支持按计划自动执行重复任务，Agent 可跨文档、邮件、Slack、Linear 等工具运行，管理员可通过集中控制台进行权限和审计管理。

跨工具自动化能力覆盖企业常见工作流，减少人工重复操作
管理员享有集中控制台，支持基于角色的访问控制与人工审批门禁
适合销售、IT 等多部门团队构建专属自动化 Agent

9. Google 推出 Gemini Enterprise Agent Platform，统一企业 AI 技术栈

Google 发布 Gemini Enterprise Agent Platform，帮助技术团队大规模构建和管理 AI Agent，同时让业务人员零代码使用和创建智能体。平台底层集成 Vertex AI，支持 Gemini 3.1 Pro/Flash Image、Lyria 3 及 Claude Opus 4.7 等多模型，与全员版 Gemini Enterprise App 深度集成。

统一平台降低企业 Agent 开发与治理门槛，IT 建能力、业务直接用
多模型支持避免单一模型供应商锁定，Claude 4.7 首次纳入 Google 平台

10. Google Workspace Intelligence 全面上线，Gemini 赋能 Docs 和 Sheets

Google 宣布 Workspace Intelligence 面向所有 Workspace 客户及 AI Ultra/Pro 用户全面开放。通过整合 Gmail、Calendar、Chat、Drive 数据，为 Docs 提供智能写作与风格模仿，为 Sheets 提供自动构建表格和智能填充。

文档和数据表格层面全面接入 Gemini，企业办公工作流自动化再进一步
所有 Workspace 客户均可使用，无需额外付费或申请

声明：本内容由AI生成，可能包含不准确或推测性信息，请读者自行甄别并谨慎参考。

欢迎点赞收藏

持续关注每日AI前沿动态

– 立即扫码 –

更多资讯，

点击下方卡片关注赛凡智云协作平台

▲ 赛凡云盒，一款超好用的企业私有云盘