AI Daily Brief
2026年5月25日 · 周一
Anthropic三款未发布模型Mythos-1/Opus 4.8/Sonnet 4.8同日曝光,Mythos-1漏洞发现能力远超前代; GPT-5.6多个内部测试变体被发现,预计6月发布; NextEra以670亿美元收购Dominion Energy成美国史上最大电力合并案,应对AI数据中心能源需求
Today's Highlights
1 Anthropic三款未发布模型同日曝光:Mythos-1、Opus 4.8、Sonnet 4.8
2 GPT-5.6泄露暗示6月发布,多个内部测试变体曝光
3 研究人员用Claude Code自主发现AI推理算法,token消耗降低70%
4 NextEra以670亿美元收购Dominion Energy,打造AI数据中心专用电力网络
5 AMD苏姿丰指出HBM已成AI芯片供应新瓶颈,消费级DRAM价格飙升
6 AI Agent系统Design Conductor首次自主完成从需求到7nm芯片布局全流程
7 微软研究院发布Webwright终端原生Web代理框架,准确率达60.1%
8 谷歌CEO Pichai坦承Gemini在编程Agent领域落后于竞争对手
9 教皇利奥十四世发布首份AI通谕《Magnifica Humanitas》
10 AWS MCP Server正式GA,为AI代理提供IAM治理和全API覆盖
1 Anthropic三款未发布模型同日曝光:Mythos-1、Opus 4.8、Sonnet 4.8 AI模型 网络安全 Anthropic Anthropic的三款未发布AI模型在同一天被曝光。网络安全模型Mythos-1短暂出现在Claude Code界面中,该模型在Firefox漏洞利用测试中生成181个有效载荷(Opus 4.6仅2个),已通过Project Glasswing计划联合AWS、Google等11家巨头发现超1万个高危漏洞,包括FreeBSD中存在17年的RCE漏洞。Claude Opus 4.8在Google Vertex AI后端被发现。Sonnet 4.8通过npm源码泄露确认将跳过4.7版本,继承Opus 4.7的视觉能力并引入新推理层级,但token消耗将增加约30%。Mythos-1目前仅限约40个合作组织使用,尚未公开发布。
2 GPT-5.6泄露暗示6月发布,多个内部测试变体曝光 OpenAI 模型发布 AI竞争 开发者在OpenAI内部测试环境和Codex日志中发现GPT-5.6相关标记,包括代号iris-alpha、ember-alpha和beacon-alpha,表明该模型已进入深度内测阶段。GPT-5.6(代号iris-alpha)在最新内部版本中实现了UI设计生成的重大突破,成功生成了一款名为Lumen Notes的极简笔记应用,显著优于以往AI生成的杂乱界面。新版本预计将重点提升多步推理、代码调试、长上下文理解、自主代理工作流及前端界面生成能力。OpenAI或同时推出标准版和Pro版,预计6月正式发布,将与Claude Sonnet 4.8、Gemini 3.5 Pro同期竞争。
3 研究人员用Claude Code自主发现AI推理算法,token消耗降低70% AI研究 推理优化 UMD、Google、Meta等机构研究人员提出AutoTTS方法,让Claude Code作为编码代理在模拟环境中自主搜索最优的测试时扩展(TTS)算法。AI发现的算法在AIME和HMMT等数学基准上,以比标准自洽方法低约70%的token消耗实现了相当或更高的准确率,并能迁移到DeepSeek-R1和GPQA-Diamond等不同模型和任务。该算法基于模型置信度动态调整搜索路径,展现出人类难以手动设计的协调逻辑。整个发现过程仅耗资约40美元、耗时160分钟。研究标志着从人工编写算法向构建搜索空间的范式转变。
4 NextEra以670亿美元收购Dominion Energy,打造AI数据中心专用电力网络 AI基础设施 能源 并购 NextEra Energy以670亿美元收购Dominion Energy,成为美国史上最大电力公司合并案。此次收购旨在应对AI数据中心激增的能源需求,打造专门为AI基础设施供电的能源网络。电力已成为AI扩展的主要瓶颈之一,数据中心的电力需求正以前所未有的速度增长。该交易凸显了AI产业对能源基础设施的深度依赖,也反映出传统能源行业正加速与AI产业融合。此前已有黑石投资50亿美元与谷歌合作建设数据中心等类似布局。
5 AMD苏姿丰指出HBM已成AI芯片供应新瓶颈,消费级DRAM价格飙升 芯片供应链 HBM AMD AMD CEO苏姿丰在5月23日指出,AI芯片供应瓶颈已从先进封装技术转移至高带宽内存(HBM)。HBM每GB消耗三倍于DDR5的晶圆容量,且良率低,供应紧张。Nvidia、Google、AMD和Amazon已占据90%以上的HBM和CoWoS产能,导致消费级DRAM供应减少。TrendForce数据显示2026年Q1常规DRAM合约价环比上涨90-95%,Q2预计再涨58-63%。Gartner预测到2026年底DRAM和SSD价格将比2025年高出130%,推动PC均价上涨17%,低于500美元的入门级PC市场将在2028年前消失。
6 AI Agent系统Design Conductor首次自主完成从需求到7nm芯片布局全流程 芯片设计 AI Agent 自动化 AI Agent系统Design Conductor仅凭219字的需求描述,在12小时内自主完成了从架构设计、RTL编码、功能验证、时序收敛到7nm GDSII布局生成的全部芯片设计流程,工程师全程未干预。该系统由规划、审查、实现、集成、根因分析和PPA收敛等多个子Agent组成,通过LLM协调EDA工具链。系统能自主分析VCD波形、定位流水线逻辑缺陷并生成修复方案,但消耗了数千亿token。设计的VerCore是简单RISC-V核心,性能有限且尚未流片,但验证了AI驱动端到端芯片设计的技术可行性。
7 微软研究院发布Webwright终端原生Web代理框架,准确率达60.1% Web Agent 微软 开源 微软研究院发布Webwright,一种终端原生的Web代理框架,通过让代理编写和运行Playwright脚本而非逐步预测浏览器动作来完成网页任务。在Odyssews基准上,Webwright配合GPT-5.4得分60.1%,相比基线GPT-5.4的33.5%提升79.4%;在Online-Mind2Web上达到86.67%准确率。该框架仅约1000行代码,无需多代理编排。小模型Qwen3.5-9B配合预建工具库也能在困难任务上达到66.2%。任务脚本可打包为可复用CLI,跨Claude Code、Codex等平台共享。
8 谷歌CEO Pichai坦承Gemini在编程Agent领域落后于竞争对手 Google AI竞争 编程Agent 谷歌CEO Sundar Pichai在纽约时报播客采访中坦率承认,在代理式编程(Agentic Coding)、工具调用、指令遵循和需要多步推理的长期任务方面,Gemini确实落后于Anthropic和OpenAI。他表示谷歌正通过发布Gemini 3.5 Flash等新模型和内部工具Antigravity 2.0来弥补差距,后者的内部token使用量每周翻倍。Pichai同时表示AI发展速度极快,当前30-60天的变化相当于过去5年,AGI可能比预期更近,并认为公众对AI的焦虑是合理的。
9 教皇利奥十四世发布首份AI通谕《Magnifica Humanitas》 AI伦理 政策 宗教 教皇利奥十四世于5月25日发布首份关于人工智能的教宗通谕《Magnifica Humanitas》,探讨AI对人类尊严、劳动与伦理的影响,与Anthropic联合创始人共同强调AI时代下对人的保护。这是天主教会首次以正式通谕形式系统回应AI技术发展,被视为AI被纳入与工业革命同等级别的社会变革议题的标志性事件。该通谕的发布时间正值全球AI产业加速发展、多家AI公司推进IPO之际,凸显了技术伦理讨论的紧迫性。
10 AWS MCP Server正式GA,为AI代理提供IAM治理和全API覆盖 AWS AI Agent 云服务 AWS宣布其托管的模型上下文协议(MCP)服务器正式GA,为AI编码代理提供基于IAM的访问控制、CloudWatch指标监控和CloudTrail日志审计。该服务器支持所有AWS API(包括长时间运行的操作和文件上传),并允许代理在沙箱化Python环境中执行多步任务,无需本地文件系统或shell访问权限。MCP Server属于新推出的开源Agent Toolkit for AWS的一部分,为代理提供最新文档、受控API访问和操作指导,旨在减少错误和token消耗,使AWS成为AI编码代理的默认平台。
AI Daily Brief
最新、最快、最有价值的 AI 资讯 每天只需几分钟,紧跟全球智能浪潮
AIDailyBrief.cn
点击下方查看原文,获取更多 AI 资讯