🚀 核心模型与技术突破
DeepSeek V4 完整论文发布:FP4 精度引发行业震动:DeepSeek 今日正式发布了长达数十页的 V4 技术白皮书。
FP4 量化训练:V4 首次披露在训练后期直接采用 FP4(4位浮点) 精度进行“量化感知训练”,推理速度提升 2 倍,而模型质量损耗几乎为零。
极致成本:相比 V3.2,新一代 Pro 版的 KV 缓存占用仅为前代的 10%,Flash 版更是压低到了 7%。这意味着同样的硬件现在能支撑 10 倍以上的并发智能体。
训练稳定性:详细记录了应对万亿参数 MoE 模型“损失尖峰”的两大黑科技:预期路由(Anticipatory Routing)和 SwiGLU 限制(Clamping),解决了大模型训练容易“跑飞”的业界难题。
GPT-5.5 深度研究功能(Deep Research)升级:OpenAI 今日优化了 ChatGPT 的深度研究模式,用户现在可以指定特定网站和已连接的第三方 App 作为“信任源”,并能在研究开始前实时编辑和调整 AI 生成的调研计划。
👀 官方预告:Google I/O 2026 日程公开
“Agent 开发者工具”成为主角:Google 官方今日公开了 5 月中旬大会的详细日程。
Chrome 智能体:将推出 Chrome DevTools for agents,旨在让 AI 智能体能像人类一样理解和操控复杂的网页 DOM 结构。
Antigravity 引擎:Google 展示了全新的 Google Antigravity 跨端 AI 渲染框架,旨在实现 AI 驱动的“一次编写,处处运行(Vibe once, run anywhere)”。
科学 frontiers:Demis Hassabis 将主持一场关于“AI 与科学边界”的对话,外界猜测可能会发布 AlphaFold 3 的后续重大更新。
🛡️ 安全与职场趋势
OpenAI 全面上线“信任联系人”:针对个人账户的自杀干预安全功能今日起分批推送。当 AI 检测到严重安全信号时,会主动联系用户设置的紧急联系人。
美国职场“AI 识别危机”:最新调查显示,虽然 74% 的美国员工认为自己能分清 AI 还是真人,但实际测试中误判率极高。这引发了关于“职场信任”的讨论:当 AI 同事和人类同事听起来一模一样时,透明度正成为办公室政治的新焦点。
AI 诈骗“服务化”门槛降低:安全机构今日警告,“诈骗即服务(FaaS)”正在兴起,即使是没有技术背景的犯罪分子,现在也能通过租用 AI 自动化工具发起高水平的行为操纵攻击。
🤖 智能体(Agent)落地快讯
Anthropic 深入金融核心:Anthropic 今日发布了一套专为华尔街打造的金融 Agent,能够自主处理复杂的财报对齐、风险合规审计等繁琐任务。
DeepSeek V4-Pro 用户满意度调查:Reddit 上的开发者实测显示,52% 的用户已将 V4-Pro 设为默认的 Coding Agent 底座,其在中文写作质量上相比 Gemini 3.1 Pro 有着近 15% 的领先优势。
夜雨聆风