AI 快讯 | 6月04日 18:30 — 6月05日 18:30
信息来源于网络,文章由 AI 生成
时段摘要
▸ Anthropic 发布长篇报告,披露超过 80% 代码由 Claude 编写,工程师人均代码产出提升 8 倍,呼吁建立全球 AI 放缓机制
▸ 腾讯 集中发布 20 余款 Agent 产品,首席 AI 科学家 姚顺雨首次公开亮相,宣布混元大模型不再打榜、转向场景 Co-Design
▸ 商汤 开源办公技能体系 SenseNova-Skills,可实现数据分析到 PPT 全链路自动交付
▸ 金山办公 发布 AI 原生笔记产品 WPS 笔记,AI 贯穿从录入到复用全过程
▸ Pinterest 与 AWS 签署 40 亿美元合作协议,引入 Trainium 芯片驱动 AI 服务
▸ CMU 联合多所大学发布论文,提出 LLM「睡眠」记忆巩固机制,复杂推理任务准确率提升显著
▸ 国星宇航 与 腾讯云 签署「星算」计划战略合作,共建 AI 云服务生态
▸ Aippy 完成数千万美元首轮融资、估值 2.5 亿美元,向「AI 版 TikTok」迈进
大模型前沿

图:来源 tmtpost.com

图:来源 tmtpost.com
Anthropic 释放自进化信号。 在最新博客报告中,Anthropic 披露截至 2026 年 5 月,公司代码库超过 80% 由 Claude 编写,工程师人均代码产出较 2024 年提升 8 倍。更值得关注的是自主工作时长指标:内测中的 Mythos 模型已可连续自主工作超过 16 小时,达到 METR 测试框架上限,预测 2027 年可能达到数周。
Anthropic 将 AI 介入开发分为五个阶段,自述已处于第四阶段末尾。在 AI 安全研究实验中,Claude 用约 800 小时、1.8 万美元算力恢复了 97% 的性能缺口,两名人类研究员一周仅恢复 23%;代码优化任务中 Claude Mythos Preview 实现了 52 倍加速,人类研究员仅达 4 倍。
然而钛媒体分析指出,当前「研究品味」——判断什么问题值得做的能力——仍是卡住完整递归自我改进(RSI)的关键瓶颈。Claude Mythos Preview 在判断下一步研究方向时正确率约 64%,五个月前为 51%,虽呈上升趋势,但离完全自主判断仍远。Anthropic 自身也列出了三种可能结局,其中最可能的是「AI 持续加速但人类仍掌握方向盘」。
与此同时,OpenAI 和 Anthropic 罕见同声,均发出 AI 自进化可能失控的警告。Anthropic 呼吁建立类似核武器条约的全球 AI 开发放缓协议及核查机制。但外界质疑声音不断:Anthropic 估值已接近 1 万亿美元并正推进 IPO,被批评为借安全之名行竞争限制之实。
CMU 提出 LLM「睡眠」机制。 卡内基梅隆大学联合马里兰大学等机构发表论文《Language Models Need Sleep》,受动物睡眠记忆巩固启发,提出让 LLM 在上下文窗口填满后进入「睡眠」状态,通过 N 次递归传递将关键信息转化为 SSM 模块的持久权重。实验显示,在数学推理任务上,Jet-Nemotron 2B 模型经 6 次睡眠循环后 6 步运算准确率从 0.742 提升至 0.812,Ouro 1.4B 从 0.419 提升至 0.615。题目越复杂,提升越明显。不过该方法尚处于方法论探索阶段,训练成本随睡眠次数线性增长。
腾讯AI动态

图:来源 tmtpost.com

图:来源 tmtpost.com
姚顺雨首次公开亮相,释放腾讯 AI 转向信号。 在 6 月 5 日的腾讯 AI 产业大会上,首席 AI 科学家姚顺雨与汤道生进行近一小时对谈,明确混元大模型「不再打榜、转向场景实用性」。姚顺雨透露,混元与元宝已建立 Co-Design 机制——模型新版本优先交付元宝使用,后训练骨干力量直接派驻产品团队。这一协同已产生网络效应:混元在聊天和搜索上的能力被迁移至 ima 和 WorkBuddy,不同产品的数据相互泛化。
汤道生同时回应多个焦点问题:腾讯当前最大投入仍在元宝,80% 用户已在使用 Hy3 Preview;WorkBuddy 发布 3 个月迭代 43 个版本,按 DAU 计已是国内最受欢迎的桌面智能体产品;CodeBuddy 覆盖超过 95% 腾讯工程师,编码时间缩短 40%。关于自研芯片,汤道生明确表示「自己做芯片设计不能解决产能问题」,倾向与更多芯片厂商合作。
腾讯集中发布 20 余款 Agent。 大会同步发布「效率智能体工具集」,涵盖 QClaw、ima、元宝、WorkBuddy、CodeBuddy、妙境 Miora、Ardot 等核心产品,以及 TokenHub 大模型服务平台、Agent Runtime 基础设施和 ADP4.0 智能体开发平台。TokenHub 上线 3 个月日供给量达 5 万亿 Token 级别,Agent Runtime 可释放 70% 闲置算力,沙箱拉起时间仅 60 毫秒。
AI基础设施

图:来源 qbitai.com

图:来源 qbitai.com
Pinterest 投入 40 亿美元深化 AWS 合作。 Pinterest 计划在 2031 年前在 AWS 云服务上投入 40 亿美元(约 271 亿元人民币),重点引入 AWS Trainium 芯片驱动 LLM/VLM 模型推理,用于个性化视觉搜索和 AI 辅助发现体验。目前约三分之一计算基础设施已运行在 AWS Graviton Arm CPU 上。Pinterest CTO Matt Madrigal 表示此举将「加速实现新一代视觉发现体验的 AI 愿景」。
国星宇航与腾讯云签署「星算」计划。 6 月 5 日,双方签署战略合作协议,聚焦 AI 云服务领域,推动 AI 智能体场景落地和企业数字化转型。合作旨在构建覆盖多维空间的高效云服务体系,加速商用高端算力与数字产业的深度融合。
AI应用落地

图:来源 zhidx.com

图:来源 zhidx.com
商汤开源 SenseNova-Skills 办公技能体系。 三大核心技能——数据分析、深度研究、PPT 生成——采用模块化设计,支持自由拼接,一条指令即可完成从数据到分析报告再到 PPT 的端到端闭环。产品已开源至 GitHub(Apache 2.0 协议),SenseNova U1 系列模型公测期每 5 小时提供 1500 次免费调用额度。普通用户可通过「小浣熊」智能体零代码体验。
金山办公发布 WPS 笔记。 作为 AI 原生多模态笔记产品,WPS 笔记支持语音、图片、文字、网页等多种录入方式,AI 能力覆盖从记录、理解、整理到检索、复用的五步闭环。产品内置多级 AI 自动标签体系,支持全域多模态检索,并可作为 MCP 服务供 Cursor、Claude 等第三方 AI 应用调用。内测期间已吸引超 1 万名用户。
AI 互动游戏社区 Aippy 完成首轮融资。 由赤子城科技 CTO 叶椿建创办的 Aippy 获得歌未资本数千万美元投资,投后估值 2.5 亿美元。产品海外上线一年月活接近 200 万,核心用户为欧美 Gen Z 和 Gen Alpha。但分析指出,成为日活 5000 万平台预计需要 10-60 亿美元前期投入,算力成本与商业化之间的平衡仍是最大挑战。
夜雨聆风