1. OpenAI发布重磅更新:GPT-5.5和实时语音模型
GPT-5.5正式发布,这是目前最强大的agentic模型:
- Terminal-Bench 2.0准确率达82.7%,刷新SOTA
- 支持128K超长上下文,处理复杂工作流
- 已在NVIDIA Blackwell系统上运行,debug效率大幅提升
GPT-Realtime-2将GPT-5级推理带入实时语音:
- 支持并行工具调用,可同时执行多个后端请求
- 上下文窗口从32K扩展到128K
GPT-Realtime-Translate:实时翻译,支持70+语言到13种输出语言,每分钟仅0.034美元
GPT-Realtime-Whisper:流式语音转文字,延迟更低,每分钟0.017美元
实测数据:Zillow使用后电话成功率从69%跃升至95%
2. Google DeepMind:AI数学家助手登上舞台
发布AI co-mathematician系统(基于Gemini 3.1):
- 多智能体协作:项目协调、专项研究、文献检索、代码验证
- 拓扑学家用它解决了Kourovka笔记本中困扰60年的开放问题
- FrontierMath Tier 4基准测试得分48%,创AI新纪录
AlphaEvolve同时登场:
- 用AI自动发现算法,已超越Strassen 1969年的矩阵乘法记录
- 发现了Gemini训练内核优化,使训练速度提升23%
- 优化了Google全球数据中心调度,节省0.7%算力资源
3. NVIDIA:Star Elastic一键生成三个模型
一项训练,同时产出30B、23B、12B三档模型:
- 存储空间从126GB降至59GB(FP16)
- 30B版本仅需18.7GB(NVFP4),可跑在RTX 5080上
- token消耗减少360倍vs从零训练
Nemotron 3 Nano Omni开源发布:
- 首个统一视觉、音频、语言的多模态模型
- 推理效率提升9倍vs其他开源全模态模型
- 支持1920x1080原生分辨率,可操控电脑界面
4. 百度文心大模型5.1发布
- Arena Search排行榜全球第四、中国第一(1223分)
- 参数量压缩至三分之一,激活参数减半
- 预训练成本仅为同等规模模型的6%
- AIME26数学推理得分99.6,仅次于Gemini 3.1 Pro
本周要点

夜雨聆风