

AI 日报 2026年5月14日
1.破零!GPT-5.5攻克所有AI交白卷的「地狱级」编程难题。
Meta联手斯坦福、哈佛推出的ProgramBench编程基准,200道从零重建程序的难题曾让所有前沿AI通过率为0%。近日,GPT-5.5首破纪录,用C和Python两种语言解出经典程序cmatrix,xhigh模式断层碾压Claude Opus 4.7。Opus虽展现出色系统工程能力,却因两个低级bug失利。此次突破印证,推理算力已成编程AI核心竞争力,目前该基准仍有199道题待解。

2.安卓革命性更新!Gemini Intelligence全面植入,兼容AirDrop。
谷歌在发布会上重磅推出Gemini Intelligence,无缝植入安卓全设备,可跨应用完成多步任务、智能填表等。同时发布全新品类Googlebook,合并安卓与ChromeOS,支持多设备协同。此外,Quick Share兼容AirDrop,优化iOS转安卓迁移流程,RCS消息实现端到端加密,谷歌以开放姿态布局AI智能,与苹果展开终端智能竞争。

3.杀进法律圈!Claude携20+连接器+12款插件,律所已全面启用。
Anthropic正式进军法律行业,推出20+款MCP连接器及12个专业法律插件,打通整个法律技术栈。这些工具可无缝对接Word、Excel等办公软件,覆盖商业、企业、诉讼等多法律领域,能自动化合同审查、合规核查等核心工作。目前已有律所借助其跑通全业务,Claude还联动公益机构,推动法律服务更可及,持续拓展AI行业应用边界。

4.开源端侧王者!MiniCPM-V 4.6发布,1.3B参数碾压同尺寸模型。
面壁智能联合清华大学、OpenBMB开源社区发布并开源端侧多模态模型MiniCPM-V 4.6。该模型仅1.3B参数,6G内存即可流畅运行,性能登顶全球同尺寸模型,全面超越阿里Qwen3.5-0.8B等竞品,效率实现反超。目前已在Github、Hugging Face等平台开源,支持多系统手机使用,部署便捷且成本极低。

5.微信元宝新玩法实测!转发聊天记录,一键搞定整理、参谋需求。
腾讯微信元宝新增实用玩法,支持一键转发微信群聊消息、发票、视频等给元宝,可快速整理发票信息、生成旅行计划、参谋情感回复等。实测中其梳理碎片化信息表现出色,但在视觉理解、数据统计时存在幻觉问题。该功能支持对话阅后即焚,兼顾便捷与隐私,进一步深化AI与微信生态的融合。

6.传奇联动!《星球大战》首映影院,成Cursor新办公区。
《星球大战》首映的传奇影院,如今成为Cursor新办公区。创始人CEO在新办公区首场活动中演讲,将软件开发划分为Tab、Agent、Team三纪元。数据显示,2025年Cursor Agent请求量暴涨15倍,企业业务线75%代码由AI生成,内部30%PR由Agent端到端完成,其还实验让Agent团队自主开发浏览器,探索AI编程未来。

7.Meta前大神田渊栋出山,加入AI独角兽任联创。
Meta FAIR前研究科学家总监田渊栋离职后,现身AI独角兽RSI(Recursive Superintelligence)联创名单。RSI刚隐身现身就斩获6.5亿美元融资,估值达46.5亿美元,谷歌GV等领投。其8位联创阵容豪华,核心聚焦AI递归式自我改进,计划先打造自动化AI科研系统,再应用于药物研发等领域,押注AI下一轮能力跃迁。

8.清华重磅研究!破解OPD蒸馏难题,明星技术不再“失灵”。
OPD已成为大模型后训练明星技术,却存在强Teacher模型无法提升Student性能的反直觉问题。清华大学团队最新研究拆解其黑箱,揭示两大核心法则,深挖Token级对齐机制,并给出两招实用方案拯救失败蒸馏,同时指出OPD在长轨迹场景存在局限。

9.小米正式开源自动驾驶模型Xiaomi OneVL,推理又快又准。
近日,小米技术正式发布并全面开源自动驾驶模型Xiaomi OneVL,这是一步式潜空间语言视觉推理框架。它统一VLA、世界模型和潜空间推理三大技术路线,精度超越显式思维链,推理延迟最低仅0.24秒,仅为传统VLA自回归推理的5.4%,多基准达SOTA,为量产车端实时部署提供可行路径,助力小米辅助驾驶迈向“理解与推理”新阶段。

10.具身智能少数派黄岩:以架构创新破局数据依赖。
在具身智能算力竞赛热潮中,黄岩是稀缺的少数派。他避开主流数据路线,聚焦架构创新,研发BridgeVLA、BridgeV2W等模型,解决少样本学习、风险预判等核心难题,提出E-TTS赋予机器人深度推理能力,以“认知驱动”思路打破数据依赖,推动具身智能从实验室走向工业落地,沉淀难以复制的技术优势。

夜雨聆风