乐于分享
好东西不私藏

2026年4月23日AI日报 | 小米连发四款大模型,Agent 战场再掀开源风暴

2026年4月23日AI日报 | 小米连发四款大模型,Agent 战场再掀开源风暴

AI日报
2026.4.23日资讯速递

1. 小米发布 MiMo-V2.5 系列四款模型,两款即将开源

小米宣布开启 MiMo-V2.5 系列大模型公测,包含 V2.5、V2.5-Pro、V2.5-TTS Series 及 V2.5-ASR 四款。其中 V2.5-Pro 定位复杂长程 Agent 任务,官方称其在通用智能体能力和软件工程维度已媲美 Claude Opus 4.6 及 GPT-5.4;V2.5 为原生全模态模型,能同时处理视觉、听觉与文本信息。MiMo-V2.5 和 V2.5-Pro 即将开源。

  • V2.5-Pro 可稳定完成近千轮工具调用的长程专业任务,支持复杂软件工程场景

  • V2.5 原生全模态+成本优势:以约一半 API 成本超越上一代 V2.2-Pro 智能体性能

  • 即将开源的两款模型预计将进一步降低 Agent 开发门槛


2. Meta 推出即时测试方法,AI 辅助开发缺陷检测能力提升 4 倍

Meta 在代码评审期间引入即时测试方法,替代传统需要长期维护的测试套件。该方法基于代码差异动态生成有针对性测试,在 AI 辅助开发环境中将缺陷检测能力提升约 4 倍,检测有意义失败最高提升 20 倍。

  • 核心技术结合大语言模型、程序分析和变异测试(注入合成缺陷验证测试有效性)

  • 关键组件包括 Dodgy Diff 与意图感知工作流架构,将代码变更重新定义为语义信号

  • 评估基于超过 22,000 个生成测试,适用于 Agent 工作流代码生成量大的场景


3. Qwen 团队开源 Qwen3.6-27B,编程能力超越前代旗舰

阿里 Qwen 团队发布 270 亿参数开源稠密模型 Qwen3.6-27B,原生支持多模态及思考模式。其编程能力在所有主要基准上全面超越前代开源旗舰 Qwen3.5-397B-A17B,权重已在 Hugging Face 和 ModelScope 开放。

  • 270 亿参数规模兼顾性能与部署成本,适合私有化落地场景

  • 编程能力全面超越此前参数量更大的旗舰模型,开源密度提升

  • 用户可通过 Qwen Studio 或阿里云百炼 API 直接调用


4. Claude Code ultrareview 功能上线,Pro/Max 用户免费 3 次

Claude 官方宣布 Claude Code 的 /ultrareview 代码审查功能面向 Pro 和 Max 用户提供截止 5 月 5 日的 3 次免费使用机会。该功能通过云端多 Agent 并行审查代码,自动将结果反馈至 CLI 或 Desktop 客户端。

  • 审查在云端运行,不占用本地资源,适合快速 Review 大型代码库

  • 5 月 5 日前有效,额度有限


5. 商汤绝影发布端侧大模型 Sage,32B 参数激活 3B 超越云端旗舰

商汤绝影推出端侧多模态大模型 Sage,总参 32B、激活仅 3B,将云端级智能体能力落地端侧。Sage 在 Agent 评测基准 PinchBench 上超越 Claude Opus 4.6 及 GPT-5.4,已在英伟达 Orin 实现部署,核心技术包括 SCOUT 分级协同学习与 ERL 可擦除强化学习

  • 32B 总参/3B 激活参数设计,解决端侧设备算力限制与智能化不足的矛盾

  • SCOUT 框架将”探路”与”学习”解耦,ERL 支持模型主动识别并原地修正推理错误

  • 北京车展期间将推出搭载 Sage 的 SageBox 硬件,实现车载系统联动


6. Zed 推出 Parallel Agents,支持多 Agent 并行编排

Zed 编辑器发布 Parallel Agents 功能,允许用户在单一窗口内并行运行和编排多个 Agent,通过 Threads Sidebar 集中管理,支持按项目分组、跨仓库读写、按线程组合不同 Agent 及按需隔离工作树。

  • 针对 Agent 工作流优化了默认面板布局,macOS/Windows/Linux 全平台支持

  • 开发者可组合多个 Agent 同时处理不同任务,提升复杂项目开发效率


7. Hermes Agent 限时免费开放 Kimi K2.6 和 Step 3.5 Flash

Hermes Agent 宣布在 Nous Portal 上限时免费提供 Kimi K2.6(未来 24 小时)和 Step 3.5 Flash(10 天内)。用户可通过执行 hermes update 后在 hermes model 中选择对应模型名称配置使用。

  • Kimi K2.6 由 Vercel AI Gateway 和 Moonshot 提供支持,24 小时限时

  • Step 3.5 Flash 由 StepFun AI 支持,10 天窗口期


8. OpenAI 在 ChatGPT 上线 Workspace agents,企业可共享与定时执行 Agent

OpenAI 面向 Business/Enterprise/Edu 订阅推出 ChatGPT Workspace agents 功能,团队可构建特定能力 Agent 并在工作区内共享,支持按计划自动执行重复任务,Agent 可跨文档、邮件、Slack、Linear 等工具运行,管理员可通过集中控制台进行权限和审计管理。

  • 跨工具自动化能力覆盖企业常见工作流,减少人工重复操作

  • 管理员享有集中控制台,支持基于角色的访问控制与人工审批门禁

  • 适合销售、IT 等多部门团队构建专属自动化 Agent


9. Google 推出 Gemini Enterprise Agent Platform,统一企业 AI 技术栈

Google 发布 Gemini Enterprise Agent Platform,帮助技术团队大规模构建和管理 AI Agent,同时让业务人员零代码使用和创建智能体。平台底层集成 Vertex AI,支持 Gemini 3.1 Pro/Flash Image、Lyria 3 及 Claude Opus 4.7 等多模型,与全员版 Gemini Enterprise App 深度集成。

  • 统一平台降低企业 Agent 开发与治理门槛,IT 建能力、业务直接用

  • 多模型支持避免单一模型供应商锁定,Claude 4.7 首次纳入 Google 平台


10. Google Workspace Intelligence 全面上线,Gemini 赋能 Docs 和 Sheets

Google 宣布 Workspace Intelligence 面向所有 Workspace 客户及 AI Ultra/Pro 用户全面开放。通过整合 Gmail、Calendar、Chat、Drive 数据,为 Docs 提供智能写作与风格模仿,为 Sheets 提供自动构建表格和智能填充。

  • 文档和数据表格层面全面接入 Gemini,企业办公工作流自动化再进一步

  • 所有 Workspace 客户均可使用,无需额外付费或申请

声明:本内容由AI生成,可能包含不准确或推测性信息,请读者自行甄别并谨慎参考。

欢迎点赞收藏

持续关注每日AI前沿动态
– 立即扫码 –
更多资讯,
点击下方卡片关注赛凡智云协作平台
▲ 赛凡云盒,一款超好用的企业私有云盘