4月9日 AI 更新

今天的主角是安全、基础设施与工具链，端侧与本地化能力也在继续扩张。Anthropic 宣布了更强的安全专项模型和公测的 Claude Managed Agents；Gemma 4 走向更广泛的本地设备；Microsoft 释放统一 Markdown 转换工具和上下文压缩研究；Grok 4.20 被评测为非幻觉率第一。

安全与可控

Anthropic 推出了名为 Project Glasswing 的安全专项计划，其核心是最新前沿模型 Claude Mythos Preview。该模型在漏洞发现能力上被描述为仅弱于极少数最顶尖的人类安全专家。官方报告显示，该模型能够在各主要操作系统与 Web 浏览器中发现数千个零日漏洞，并能将多个漏洞自动串联成完整的攻击链，包括远程 Root、内核写入权限提升等。出于对潜在破坏的担忧，Anthropic 明确表示 Mythos 不会公开发布，而是通过 Glasswing 计划与少数经过严格筛选的合作伙伴共享。这标志着行业在能力扩张与安全管控之间的平衡正在收紧：前沿模型的力量正在进入防御体系，但也意味着最强大的能力将保持封闭。

基础设施与工具链

Claude Managed Agents 正式进入公测阶段，为构建和规模化部署代理提供了一体化基础设施：从原型到生产环境，通常只需几天。它将针对性能调优的代理框架与生产级基础设施结合，适合复杂任务编排与持续运行。与此同时，生态中的开源与第三方工具也在丰富：Prism 新增了 Paper Review 工作流，用 AI 帮助提升科研论文的严谨性与可复现性，而不是简单的「摘要式」生产；Microsoft markitdown 将 PDF、Word、Excel、PowerPoint、音频、YouTube 视频等转换为干净的 Markdown，大幅降低上游数据管道的适配成本；Gym-Anything 将任意真实软件转化为计算机使用代理的模拟环境，目前已覆盖 200+ 软件、1万+ 任务。

微软研究院的 Memento 研究则探索了一个更底层的优化方向：训练 LLM 将推理过程分段、生成密集摘要（称为「mementos」），并从 KV Cache 中清理以释放内存。在 Qwen3-8B 等模型上，该技术可将峰值内存使用削减 2–3 倍，推理速度提升近一倍，同时通过残差中的「第二通道」保留必要信息，将精度损失控制在较低水平。该研究基于 228,000 条追踪数据构建的 OpenMementos 数据集，并已开源 MIT 许可证。

端侧与本地化

Gemma 4 的「可运行设备清单」继续扩张。不仅在手机本地运行时可以处理日志与趋势分析、在联网时发起 API 调用，也被演示在 Nintendo Switch 上以 1.5 t/sec 的速度运行，以及在 iPhone 17 Pro 上以约 40 tk/s 的速度运行。社区还涌现了免 GPU、免信用卡、无需代码的 Gemma 4 微调方案，使得更多开发者能够在浏览器环境中完成模型定制。这一趋势意味着端侧能力不再是边缘实验，而是进入可预期的实用化阶段。

与此同时，GitHub Copilot CLI 推出了从终端直接触发安全扫描的能力：扫描结果可映射到 OWASP Top 10，并批量打开 Issue 进行修复；Browser Use 与 Hermes Agent 的集成为每个代理提供了免费的云端浏览器环境，包含持久化认证与代理支持。

产品与生态

Gemini 面向 NotebookLM 的深度集成仍在推进。NotebookLM 笔记本可以直接在 Gemini 应用中作为来源使用，帮助用户在单一项目中整理对话、笔记与文件，并可随时回到 NotebookLM 做深度分析。Sundar Pichai 宣布 Gemini 正在推出的「笔记本」功能，进一步强化了项目化组织与跨工具衔接。

Grok 4.20 在第三方评测中达到 78% 的非幻觉率，被指超过 Claude Opus 4.6、Gemini 3.1、GPT-5.4 等主要模型，马斯克转发了该结果。

总评

今天的焦点在于：最强的能力正在通过专项计划进入防御体系，而不是公开货架；基础设施从模型扩展到代理编排、数据管道与工具整合；端侧能力在硬件与软件双维度稳步推进。对于开发者来说，选择变得更精细：是追求前沿模型的访问权，还是投入开源生态的端侧与本地化路径，或是依赖云端统一平台。这三条路线正在分化，而不是趋同。