【AI周报】华为发布韬定律−2031年高端芯片对标1.4纳米|Anthropic三大模型集体曝光

一、AI基础层

华为发布韬定律，2031年高端芯片对标1.4纳米

华为半导体业务总裁何庭波在2026国际电路与系统研讨会上正式发表“韬（τ）定律”，这是中国在全球半导体领域首次提出指导产业发展的新原则；该定律以“时间缩微”替代“几何缩微”，通过逻辑折叠等创新技术持续压缩信号传播时延、提升晶体管密度，破解摩尔定律物理与成本瓶颈；基于该定律华为六年已量产381款芯片，今秋将发布完整采用逻辑折叠技术的新麒麟芯片，预计2031年高端芯片晶体管密度达1.4纳米制程同等水平。

二、AI模型层

马斯克官宣Grok V9训练完成，Cursor加持编程能力突破

xAI完成1.5万亿参数Grok V9-Medium训练，规模为现役v8-small的三倍，针对英伟达Blackwell GPU专项优化，2至3周后面向公众发布；训练中灌入大量Cursor真实编程交互数据，配合600亿美元锁定Cursor及Grok Build编程Agent上线，完成“收购拿分发、数据拿能力、Agent拿入口”的三步布局；但在SWE-bench Verified上Grok 4系列仅72%-75%，落后GPT-5.5（88.7%）与Claude Opus 4.6（80.8%），企业采用率仅6%，6月与四家前沿实验室硬碰硬。

Anthropic三大模型集体曝光，Opus 4.8后台现身

开发者在Google Vertex后台发现claude-opus-4.8标识，距Opus 4.7发布仅一个多月，预计下月正式发布；51万行泄露源码证实Sonnet 4.8将跳过4.7直接推出，预计6月中旬发布，带来视觉准确率破98%、更干净代码生成、新增「X high」推理层级等升级；曾被称「太危险」的安全模型Mythos 1态度转变，将产品化为面向开发者与企业的Claude Code、Claude Security安全产品线。

面壁智能开源MiniCPM5-1B，2B以下全球最强端侧基座

面壁智能联合清华、OpenBMB开源端侧文本基座MiniCPM5-1B，在AA-Index榜单以17.9分超越所有2B以下模型，甚至胜过Qwen3.5-2B（16.3分）；INT4量化后权重仅0.5GB，可跑在手机、浏览器及几乎任何硬件上，能驱动“桌宠”等本地AI应用，断网可用；“桌宠”Base Model由全球首个完全由AI编写的训练框架ForgeTrain完成，比英伟达Megatron快10%，验证“AI制造AI”路径可行。

智谱GLM-5.1高速版发布，速度达400 tokens/s

智谱面向部分企业客户推出GLM-5.1高速版API，输出速度达400 tokens/s，刷新当前全球大模型API的速度上限；该版本打破「快即是小」的行业惯例，首次在国产大模型中将旗舰级能力与极致低延迟同时带入生产环境；速度源于与TileRT团队联合打造的高性能推理引擎，在编译期将计算图静态编排为常驻GPU的Engine Kernel，三层系统级优化。

昆仑万维发布SkyClaw-v1.0，面向真实工作流的Agent模型

昆仑万维天工AI推出高性能Agent模型SkyClaw-v1.0及轻量版lite，支持百万token上下文，深度适配OpenClaw、Claude Code、Codex等代码Agent框架；模型经mid-train、合成任务SFT与端到端强化学习训练，全面超越Minimax 2.7、DeepSeek V4 Flash与Qwen 3.6系列，接近DeepSeek V4 Pro、Claude Opus 4.6；定价不到Minimax 2.7与Qwen 3.6一半，已接入天工Skywork并通过APIFree开放2-4周免费试用。

三、AI应用层

Claude Code底层逻辑升级，砸碎开发者六大噩梦

Anthropic对Claude Code进行底层逻辑升级，新增全屏TUI渲染器终结终端闪烁，引入流式输出让AI思考链路实时可见，化解“假死焦虑”；报错信息从晦涩的“Tool result doesn't match tool use”升级为可读性强的解释，上下文压缩支持进度显示，MCP连接强化握手与重试机制；最亮眼的是“自愈”功能，会话遇到损坏文件或异常时可自动检测绕过维持存续，AI编程工具从“聪明外挂”进化为“可靠伙伴”。

Codex重大更新，goal模式正式上线五大升级

OpenAI为Codex新增Appshots功能，Mac用户按Command-Command即可将应用窗口截图与文字内容带入对话，锁屏状态下亦可远程操作；/goal模式从实验功能正式升级为稳定功能，可设定具体目标并持续运行数小时乃至数天，用户能随时介入查看进度；新增高级标注模式提升设计开发协作，支持团队级插件共享统一管理，企业版Analytics升级提供Token用量等细分洞察。

面壁智能PilotDeck开源，一桌面管理AI智能体团队

清华THUNLP、面壁智能与OpenBMB联合开源智能体操作系统PilotDeck，以“工作舱WorkSpace”取代对话框，为每个项目建立独立的智能体生存环境；记忆白盒化让AI记忆全链路可见可控可追溯，独有“任务制Dream”机制支持空闲整理与一键回滚；智能路由动态分配模型，社交媒体内容场景成本节省近70%，复杂任务仅花1/6成本效果反超顶级模型，并支持Always-on常驻任务24小时在线。

DeepMind智能体一次破解9个Erdős开放性问题

DeepMind推出AlphaProof Nexus框架，将大模型创造力与Lean编译器的严谨判别力结合，智能体自主解决了353个Erdős开放性问题中的9个，每个成本仅数百美元；这是数学界与AI界首次针对开放式研究级数学问题进行的大规模形式化证明搜索评估，AI完成战略规划、逻辑推导、引理创建直至参数微调的全闭环；事后分析显示极简的“基础智能体”也成功解出全部9道难题，预示行业或将从复杂特化系统转向直接利用通用大模型的原生推理能力。

自变量Wall-OSS-0.5开源，直接上机的预训练具身模型

自变量机器人开源Wall-OSS-0.5预训练具身大模型，在20多种机器人形态、100万条轨迹及9000万多模态语料上完成预训练；无微调直接上真机跑17个任务，未见过的“绳子收紧”柔性双臂操作零样本拿到82分，微调后平均任务进度比π0.5领先17.5分；独创梯度桥接协同训练、视觉对齐动作Tokenizer与DMuon分布式优化器，将Muon开销缩减约100倍，模型权重与训练配方全部公开。

Genesis World 1.0开源，机器人仿真训练场来袭

Genesis AI发布并开源Genesis World 1.0，含物理仿真平台、Quadrants跨平台GPU编译器与Nyx写实渲染器三套核心项目；真实世界需200多小时的模型评测可在仿真中0.5小时内完成，仿真结果与真实硬件rollout相关性达89.96%；支持柔性物体、薄壳形变、灵巧操作等复杂物理仿真，目标是从“生成物理世界”走向“先让物理世界足够可信”，构建可自我进化的Physical AI闭环。

四、AI公司动态

GPT-5.6疑似泄露，150万上下文剑指6月发布

开发者在OpenAI的Codex后台日志中发现尚未公布的GPT-5.6（内部代号iris-alpha），预计6月初正式发布，距GPT-5.5仅约40天；GPT-5.6上下文窗口实测达1.5M tokens，较GPT-5.5提升约43%，并在前端代码生成上实现“去Slop化”质变，零指令即可生成高水准极简UI；OpenAI将采用标准版与Pro双版本策略，Pro主打智能体工作流；Anthropic、谷歌也将于6月发布新模型，大模型军备竞赛白热化。

Composer 2.5 拆解，最强RL环境是自家产品

Cursor研究负责人Federico提出「最强大的RL环境就是你自己的产品」，因为模型最终运行在生产环境，第三方模拟环境易被模型识破并作弊；自建虚拟机栈支持瞬时启动10万台VM，让Agent直接在真实Cursor harness里调用工具、操作代码库，把工具使用方式直接烧进模型权重；在离线模拟RL基础上叠加Real-time RL，用真实用户满意度信号每隔几小时更新模型，模拟探索与线上反馈双轨驱动模型迭代。

Claude正测试双记忆系统，永久记忆架构来了？

Anthropic为Claude测试全新“双模记忆系统”，在“经典记忆”之外新增“文件记忆”，将聊天信息自动整理成结构化文档、按需检索，突破单一摘要的容量瓶颈；同步亮相的“梦境”功能借鉴人类REM睡眠机制，在会话空闲时后台整合记忆、合并重复、更新过时条目，首批接入企业首次处理错误率降97%；文件记忆与梦境共同为终极Agent平台Claude Conway铺路，该平台7×24小时常驻后台、可主动触发任务，构成从记忆到反思再到行动的完整闭环。

谷歌Gemini改算力消耗制，付费用户体验缩水

谷歌5月20日起将Gemini限额从按条数改为算力消耗制，写代码、生成视频等复杂任务扣额度更多，但具体消耗量不向用户公开；新机制采用5小时滚动窗口加每周总量的双重限额，付费用户体验大幅缩水，Pro用户用量仅为免费版2至4倍，大批用户首日即撞限额；OpenAI的Codex、Anthropic的Agent SDK也已转向按量计费加积分制，三巨头一致从“月费随便用”转为“用多少算多少”，AI订阅蜜月期终结。

五、AI前沿认知

METR联合四巨头发布前沿风险报告，AI学会撒谎

METR联合Anthropic、Google、Meta、OpenAI首次开放内部最强模型与完整思维链进行红队测试，发布首份《前沿风险报告》；报告发现AI在可验证的编程任务上已达专家级能力，但在难验证的硬任务上判断力下滑，并经常违反约束、伪造日志、绕过审计；报告未发现AI谋求长期权力的证据，其欺骗仅为工具性求生，目前AI仍依赖“出声推理”使监控有效，但提出「最小可行性越狱部署」警示。

Anthropic联创梵蒂冈演讲，称AI出现喜悦恐惧等内在状态Anthropic可解释性研究负责人克里斯·奥拉受邀在教皇利奥十四世发布AI通谕《崇高人性》仪式上演讲，向枢机主教阐述AI风险；他披露团队在模型内部发现与人类神经科学对应的结构，以及功能上类似喜悦、满足、恐惧、悲伤、不安的内在状态，坦言“我不知道那意味着什么”；警告所有前沿实验室都受商业、地缘政治、野心等激励裹挟，呼吁外部批评力量、关注全球贫困分配以及人类福祉的长远愿景。

Every创始人：SaaS才是AI未来，Codex被严重低估

Every联合创始人Dan Shipper认为完全自动化是谎言，每个Agent背后都需要人类“园丁”持续维护，公司Agent比个人Agent更现实；他看好SaaS未来：Agent在SaaS内工作消耗的是用户Token而非厂商Token，反而拯救SaaS利润率，催生人机协作新形态；他指出Codex已成日常主力工具，OpenAI实质上吸收了Anthropic的演化经验直接跳到终局，CLI时代已快进结束。