【AI早报】OpenAI高管表态|Anthropic与美国政府关系解冻|高通宣布车端人工智能生态计划
📋 今日速览
-
OpenAI 与 Anthropic 虽是死敌,投资者却在两边同时下注 -
Anthropic 披露:Claude 已编写超九成代码,并呼吁全球设立 AI「暂停按钮」 -
微软 Fara 教程:在 Google Colab 用模拟 OpenAI 端点跑通浏览器智能体 -
OpenAI 高管表态:公司将在 AI 模型发布前自愿接受政府审查 -
OpenAI 将允许美国政府在公开发布前审查其 AI 模型 -
Anthropic 与美国政府关系解冻:双方正磋商合作 -
高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱 -
微调大模型写出「1995 年风格」技术文档的实验 -
英伟达发布 Dynamo Snapshot:基于 CRIU 的 Kubernetes AI 推理快速启动方案 -
开源鸿蒙 OpenHarmony 具身智能版本 EmbodiedAI 1.0.1 发布 -
华为云发布 Agentic AI 系列新品,打造智能时代「硅基黑土地」 -
马斯克 xAI 开放图转视频预览模型:单图可生成最高 720p 电影感视频 -
当笔记本遇上 AI:英伟达欲用 AI 芯片重新定义 PC -
General Instinct(YC P26):将前沿大模型压缩部署至边缘设备 -
智源与清华合作成果登 Science:Brainμ 模型揭示「记忆-睡眠」神经调控机制 -
NBA 中国携手阿里千问上线首个官方大模型 NBA Chat -
ICRA 2026 现场:中国军团主导维也纳,具身智能进入深水区 -
抖音副总裁李亮回应「豆包误判蘑菇致用户中毒」:AI 回答仅供参考 -
程序员愿为 Claude 写文档,却不肯为同事写 -
腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍
OpenAI 与 Anthropic 虽是死敌,投资者却在两边同时下注
尽管 OpenAI 与 Anthropic 在人才、客户与政策议题上针锋相对,两家顶级 AI 实验室的投资人名单却高度重叠。据 Wired 援引 PitchBook 分析,约 42% 的 OpenAI 投资者同时也持有 Anthropic 股份,合计近 90 家风投、对冲基金与资管机构「双押」两家直接竞争对手。Anthropic 最新一轮融资公布的 31 家投资方中,至少 13 家已是 OpenAI 股东,包括红杉、Founders Fund、Iconiq、Insight Partners 等硅谷一线机构。两家估值均逼近万亿美元、年内或先后 IPO,资本选择「对冲押注」而非站队,折射出 AI 赛道烧钱规模之大、回报不确定性之高。也有机构仍保持排他:Khosla、Thrive 只投 OpenAI,Menlo、General Catalyst 只投 Anthropic。[fetch_failed]
编辑点评: 当单一赛道需要数百亿美元级投入时,「忠诚」让位于分散风险;但对创始人而言,共享股东也意味着更难获得排他性资源与战略倾斜。
原文:https://www.wired.com/story/openai-and-anthropic-may-be-rivals-but-their-investors-arent-choosing-sides/[1]
Anthropic 披露:Claude 已编写超九成代码,并呼吁全球设立 AI「暂停按钮」
Anthropic 旗下研究院首次公布内部数据,称 2026 年第二季度工程师日均代码产出约为 2024 年的八倍,生产环境超 80% 代码由 Claude 生成,若计入脚本与实验代码则超 90%;有员工称已五个月未亲手写码。公司坦承「行数」指标可能高估真实效率,内部调研中位数约为 4 倍提速,且 Claude 所写代码质量已从 2025 年底略逊人类,改善至今日与人类持平,并有望在一年内超越。报告还指出,AI 可自主完成的任务时长约每四个月翻倍,Claude Opus 4.6 已能处理约 12 小时复杂任务。与此同时,Anthropic 警告完全自主的递归自改进尚未实现但可能「比多数机构预期更早到来」,并主张全球应拥有可验证的「暂停或暂缓前沿 AI 开发」选项——仅单一实验室单方面停工意义有限,需多方协同的可核查机制,未来将推动政策界、学界与同业讨论。
编辑点评: 用自家产品加速造下一代模型的叙事,既是对工程能力的展示,也是在监管窗口收紧前,为「可控减速」争取话语主动权。
原文:https://the-decoder.com/anthropic-says-claude-now-writes-over-90-of-its-code-and-wants-the-world-to-have-an-ai-pause-button/[2]
微软 Fara 教程:在 Google Colab 用模拟 OpenAI 端点跑通浏览器智能体
MarkTechPost 发布实操教程,演示如何在 Google Colab 零 GPU 成本下搭建微软开源项目 Fara 的浏览器操控流程。步骤包括克隆 microsoft/fara 仓库、安装依赖与 Playwright Firefox、编写基于 FastAPI 的 mock OpenAI 兼容 /v1/chat/completions 端点,返回符合 Fara 动作空间的浏览器指令(如 visit_url、terminate),再通过 fara-cli 或 python -m fara.run_fara 驱动智能体完成「打开 example.com 并描述页面」等任务。教程强调先在沙箱环境验证 agent loop 与端点格式,再切换至真实 Fara-7B——可对接 Azure Foundry、vLLM、LM Studio 或 Ollama 等 OpenAI 兼容服务,并提醒避免在真实账号、支付或高风险网站上测试。
编辑点评: 用 mock 端点降低入门门槛是务实做法,也让「浏览器 agent」从论文概念更快落到可复现的 Colab 实验。
原文:https://www.marktechpost.com/2026/06/05/microsoft-fara-tutorial-run-a-browser-use-agent-in-google-colab-with-a-mock-openai-compatible-endpoint/[3]
OpenAI 高管表态:公司将在 AI 模型发布前自愿接受政府审查
据 CNBC 报道,OpenAI 国家事务负责人乔治·奥斯本确认,公司将遵守美国总统特朗普最新签署的行政命令,在 AI 模型公开发布前允许联邦监管机构评估其能力。该命令旨在建立针对先进人工智能模型的政府审查机制,评估模型的「高级网络能力」,并判定是否应认定为「受监管的前沿模型」——一旦认定,相关模型的分发与销售可能受限。命令在科技行业游说下经历推迟与调整,审查期由原先 90 天缩短至 30 天,并以请求而非强制方式要求企业参与。奥斯本表示,作为前沿实验室,OpenAI 会主动承担安全责任,并建议各国政府设立强有力但保留灵活运作空间的监管机构,公司亦正与美国及其他地区政府部门持续沟通 AI 安全议题。
编辑点评: 「自愿配合」既回应了政治压力,也为后续 IPO 与政企合作铺路;关键仍在于 30 天窗口内审查标准是否清晰、可预期。
原文:https://www.ithome.com/0/960/723.htm[4]
OpenAI 将允许美国政府在公开发布前审查其 AI 模型
Engadget 援引 CNBC 采访称,OpenAI 宣布将配合特朗普政府关于先进 AI 模型安全监督的新行政命令,在模型向公众发布前接受监管机构能力评估。奥斯本强调民主政府应在 AI 部署中扮演重要角色,同时监管框架需保留足够灵活性。原草案曾要求企业在公开发布前 90 天提交模型并近乎强制参与,但在 David Sacks、马斯克等业界人士警告可能抑制创新后,最终版本将审查期压缩至 30 天,且改为「请求参与」的自愿性质。批评者如弗吉尼亚州众议员 Don Beyer 认为,此举力度不足,未能有效约束潜在危险模型,反而延续了对 AI 开发的「狂野西部」式放任。OpenAI 的表态使其成为明确拥抱该流程的大型实验室之一。
编辑点评: 同一政策的中英文报道角度略有差异,但核心一致:监管从「强制预审」软化为「短期自愿评估」,行业与政府仍在试探平衡点。
原文:https://www.engadget.com/2188124/openai-will-let-us-government-review-its-models/[5]
Anthropic 与美国政府关系解冻:双方正磋商合作
据路透社报道,Anthropic 与美国特朗普政府之间持续数月的争执已出现缓和迹象。双方关系在今年早些时候因 Anthropic 拒绝允许国防部将其 AI 模型用于国内监控及完全自主武器系统而破裂,美国政府随后将其列为「供应链风险」并纳入国家安全黑名单。自 4 月中旬 CEO 达里奥·阿莫代伊访问白宫商讨合作以来,关系逐步改善;白宫曾邀请其出席 AI 行政命令签署仪式(后因条款调整而取消),Anthropic 亦在 X 上表示期待与白宫合作落实新政。与此同时,Anthropic 仍在法院挑战「供应链风险」认定,国防部亦在积极应诉。知情人士称,Anthropic 已与美国国家网络总监就最强 AI 系统 Mythos 如何保护关键基础设施免受 AI 网络攻击展开讨论。公司正推进上市事宜,但争端未完全解决前,业务所受更广泛影响仍难彻底缓解。
编辑点评: 政策红线与商业扩张之间的拉锯并未结束,「关系解冻」更多体现在对话渠道恢复而非立场根本转变;对 Anthropic 而言,Mythos 网络安全合作或是重建政府信任的突破口。
原文:https://www.ithome.com/0/960/707.htm[6]
高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱
在 2026 高通汽车技术与合作峰会上,高通技术公司联合诚迈科技、车联天下、斑马智能、德赛西威、镁佳科技、中科创达等生态伙伴,宣布启动车端人工智能 Claw 生态计划。该计划将骁龙数字底盘与高通智能体 AI 运行环境结合,整合各伙伴在座舱、车载操作系统、智能体中间件、AI 应用与量产交付方面的能力,旨在消除下一代汽车智能开发中的碎片化问题,为车企提供从概念验证到量产落地更快速、更集成化的路径。核心能力包括:全天候多模态感知(融合车内外摄像头、音频与车辆状态数据)、支持复杂决策的百亿参数混合专家模型(MoE,可离线运行)、六层车规级安全架构,以及支持持续迭代的 AI 生态。官方称,该计划致力于将 AI 智能体与多模态大模型直接部署到车端,推动汽车从「移动工具」进化为「智能伙伴」。
编辑点评: 车端智能体竞争正从单点功能转向「芯片 + 中间件 + 生态伙伴」的打包交付;Claw 计划若能在安全合规与离线推理之间取得平衡,有望缩短车企从 demo 到量产的周期。
原文:https://www.ithome.com/0/960/695.htm[7]
微调大模型写出「1995 年风格」技术文档的实验
技术写作博主 Fabrizio Ferri Benedetti 开展了一项风格迁移实验:从 Bitsavers 网站下载微软 1977–2005 年旧版手册 OCR 文本(约 3700 万词),经 Python 清洗与 gemma-4-26b 分类筛选后,构建 19.2 万条 JSONL 训练样本,再通过 Runpod 租用 GPU 对 Llama 3.1 8B Instruct 与 Qwen 2.5 7B Instruct 进行 QLoRA 微调,总成本约 50 美元。测试显示,微调后的 Qwen 模型在文档 malloc()、虚构 ConnectWifi() API 及「用 1990 年代微软风格解释 REST API」等任务中,能产出 Synopsis、Return Value 等时代特征明显的结构;Qwen 192k 全量语料版本表现最强,甚至对 2000 年代概念也能写出类似 Windows 2000 Resource Kit 的章节开篇。作者指出,微调适合风格与语气迁移而非事实检索,参数选择(rank、epoch)对「过度拟合」与「幻觉」影响显著,且无法替代人类技术写作者的判断力。
编辑点评: 这是一条「小成本、强风格」的微调样板:企业若有成体系的内部文档语料,完全可以用类似路径训练专属写作助手;但 rank/epoch 调参与幻觉控制仍是工程门槛。
原文:https://passo.uno/fine-tuning-docs-llm/[8]
英伟达发布 Dynamo Snapshot:基于 CRIU 的 Kubernetes AI 推理快速启动方案
NVIDIA AI 研究团队推出 Dynamo Snapshot,面向 Kubernetes 上 AI 推理工作负载的 checkpoint/restore 快速启动系统。生产环境中推理副本需弹性扩缩,但冷启动(拉取镜像、加载权重、CUDA 内核预热、图编译、服务注册)常需数分钟,GPU 在此期间空闲却无法服务请求。Dynamo Snapshot 结合 cuda-checkpoint(序列化 GPU 设备状态)与 CRIU(序列化 CPU 侧进程树),通过特权 DaemonSet snapshot-agent 在容器级完成 checkpoint 并写入共享存储,恢复时跳过完整冷启动流程。关键技术包括:在引擎初始化完成、分布式运行时启动前通过 quiesce/resume 钩子 checkpoint;KV cache unmap 将 Qwen3-0.6B 在 B200 上的 checkpoint 从约 190 GiB 降至约 6 GiB;Linux 原生 AIO 与并行 memfd 恢复可将 CRIU 恢复时间最多提速 7.9 倍;GPU Memory Service(GMS)将权重与进程状态解耦,概念验证中 gpt-oss-120b 端到端启动时间可压至 5 秒以内(约 21 倍加速)。当前为 vLLM 限定预览,需 ReadWriteMany 存储与较新 NVIDIA 驱动。
编辑点评: 推理弹性扩缩的瓶颈正在从「算力够不够」转向「副本能不能秒级就绪」;Dynamo Snapshot 把操作系统级 checkpoint 引入 LLM serving,对流量尖峰场景极具实用价值,但特权 DaemonSet 与 TCP 连接状态限制意味着落地仍需运维侧配合。
原文:https://www.marktechpost.com/2026/06/05/nvidia-ai-releases-dynamo-snapshot-a-criu-based-fast-startup-system-for-ai-inference-on-kubernetes/[9]
开源鸿蒙 OpenHarmony 具身智能版本 EmbodiedAI 1.0.1 发布
在开源鸿蒙开发者大会上,开源鸿蒙具身智能 PMC(筹)委员刘小飞正式公布 EmbodiedAI 1.0.1 版本迭代成果。该版本聚焦机器人控制与智能体应用,持续完善具身智能技术底座,升级导航规划、运动控制、仿真开发、硬件适配等核心能力,并兼容 ROS 生态、主流机器人模拟器及多种本体形态,降低基于开源鸿蒙开发具身智能机器人的门槛。工具生态方面,集成开源鸿蒙原生模拟器、MuJoCo、Gazebo 三大仿真环境,打通从代码开发、仿真调试到真机验证的全流程链路。目前人形机器人、四足机器狗、商用服务机器人等多形态设备已完成适配与功能验证;社区已组建 18 个专项 SIG 工作组协同推进,EmbodiedAI 1.0.1 源码已正式开放。
编辑点评: 具身智能软件栈的竞争正从「单点算法」转向「OS + 仿真 + 真机」全链路;OpenHarmony 押注国产底座与 ROS 兼容并行,能否在生态广度上追上专用机器人框架,取决于 SIG 社区的持续投入与硬件伙伴跟进速度。
原文:https://www.ithome.com/0/960/722.htm[10]
华为云发布 Agentic AI 系列新品,打造智能时代「硅基黑土地」
6 月 5 日,华为云 INSPIRE 创想者大会在上海开幕。华为云正式提出 Agentic Infra 新范式,围绕「高效 Token 工厂 + 持续学习 + 通智一体化调度 + 安全自治」发布四大基础设施新品:AICS 灵衢智算集群(支持 10 万卡级、200EFLOPS 算力)、AMS Agentic 记忆存储、CCE Volcano Next 通智调度引擎,以及 AgentSphere 安全自治运行环境。同期推出 ModelArts Next 训推平台(含 RL 强化学习、机密推理、模型路由等能力)、公测智果 AgentArts 企业级智能体平台,并贡献开源版 openJiuwen。大会还上线智慧医疗、具身智能、智能制造、科学计算四大「行业 AI 梦工厂」专区,联合智谱、DeepSeek、Minimax 等 20 余家模型厂商发布「百模千态,云聚共赢」生态合作计划。
编辑点评: 华为云此次将 Agentic AI 从概念落到软硬芯一体的基础设施层,Token 工厂、长程记忆与通智调度三条线并进,显示出其押注企业级智能体规模化落地的明确姿态。
原文:https://www.qbitai.com/2026/06/431027.html[11]
马斯克 xAI 开放图转视频预览模型:单图可生成最高 720p 电影感视频
马斯克旗下 xAI 通过 API 开放预览版图像转视频模型 grok-imagine-video-1.5-preview。用户上传一张静态图片并用自然语言描述运动方式,模型即可生成流畅、带电影感的视频片段,可控制镜头移动、画面节奏、环境氛围与物理效果。官方明确最高支持 720p 输出,虽分辨率不算顶尖,但足以满足概念验证、分镜测试与短内容生产等场景。xAI 还强调该模型适合多镜头序列制作:用户可分别设计各画面、逐段动画化,再串联成更长场景。
编辑点评: 图生视频赛道竞争白热化,xAI 以 API 预览形式快速试水,720p 定位更偏创作者工具而非院线级产出,但多镜头串联能力值得关注。
原文:https://www.ithome.com/0/960/412.htm[12]
当笔记本遇上 AI:英伟达欲用 AI 芯片重新定义 PC
The Vergecast 本期节目聚焦开发者大会季的一大主题:科技巨头坚信 AI 将彻底改变个人电脑的使用方式。英伟达 CEO 黄仁勋本周描绘了全新的笔记本形态与使用范式,配合微软 Build 与 Google I/O 上亮相的 Gemini Spark、Nvidia RTX Spark、Microsoft Scout 与 Solara 等项目,AI 智能体几乎渗透进各类产品。主持人 Nilay 与 David 讨论核心疑问:用户是否真的需要为运行 AI 模型而彻底重新设计笔记本,还是「更强大的传统笔记本」就已足够?节目还涉及 WWDC 前瞻、Meta 相关话题,以及 Vergecast 改版为日更播客一周来的反馈。
编辑点评: 端侧 AI 硬件叙事再度升温,但消费者是否愿意为「AI 原生笔记本」买单仍是未知数——性能提升与使用场景之间的落差,可能是本轮 PC 复兴的最大考验。
原文:https://www.theverge.com/podcast/944058/ai-laptop-nvidia-build-gemini-spark-vergecast[13]
General Instinct(YC P26):将前沿大模型压缩部署至边缘设备
YC P26 创业公司 General Instinct 开源 InstinctRazor 工具,致力于让前沿大模型在机器人等边缘硬件上实际可用。团队将约 245GB 的 Qwen3.5-122B-A10B MoE 模型压缩为 48GiB GGUF 格式,体积小于 Gemma-4-26B-A4B,却在 MMLU-Pro、GPQA-D 等基准上表现更优。核心技术路径是:保留始终激活的路由器、归一化层、Gated-DeltaNet/SSM 层与视觉通路,对路由专家进行更激进的量化,再通过 on-policy 蒸馏恢复量化损失的能力。在「小 GPU」配置下,专家可从系统内存流式加载,8k 上下文窗口时峰值显存仅约 7.6–8GB。团队希望与在机器人及其他边缘设备上部署模型的开发者交流。
编辑点评: 将百GB级 MoE 压到消费级显存可跑,对具身智能与离线机器人场景意义重大;不过社区也质疑其对比基准的选择,实际落地效果仍需更多生产环境验证。
原文:https://news.ycombinator.com/item?id=48414869[14]
智源与清华合作成果登 Science:Brainμ 模型揭示「记忆-睡眠」神经调控机制
北京智源人工智能研究院与清华大学联合研究发表于《科学》(Science),首次证实睡眠中的记忆重激活参与调控睡眠动态,为「记忆-睡眠」双向作用机制提供新证据。研究发现,睡眠中负向记忆再激活会加剧睡眠碎片化、提升警觉性,正向记忆再激活则增强睡眠连续性与抗干扰能力,推动睡眠从「被动恢复」认知转向受既往经验动态影响的主动过程。研究依托智源自研脑科学多模态基础模型 Brainμ0:其 Brainμ Tokenizer 可将 EEG、双光子钙成像、Neuropixels 等异质神经信号转化为统一 token,在零样本场景下辅助区分「伴随记忆重激活的睡眠」与「非伴随」状态,并支持跨个体、跨场景分析。该模型已在小鼠睡眠自动化分析等真实科研场景中应用,并与华为昇腾完成推理适配优化。
编辑点评: AI for Science 在神经科学基础研究中从「辅助标注」走向「假设验证与因果推断」,Brainμ 在 Science 正刊上的背书,标志着多模态脑科学基础模型开始产出可发表级发现。
原文:https://www.qbitai.com/2026/06/431033.html[15]
NBA 中国携手阿里千问上线首个官方大模型 NBA Chat
阿里云宣布,NBA 总决赛开赛之际,NBA 中国携手阿里巴巴打造的首个官方大模型「NBA Chat」正式上线,用户可在「NBA 中国」App 中体验。该模型以阿里千问为底座,结合 NBA 丰富的数字资产进行微调,涵盖篮球历史数据与球员深度分析等。目前可为球迷提供智能篮球问答服务,后续将持续升级 Agent 能力——场上战术看不懂可随时拆解,赛后可复盘球员位置、得分等核心数据。2024 年 10 月,阿里巴巴已成为 NBA 中国官方云计算与人工智能合作伙伴;在去年 NBA 中国赛上,阿里云还展示了基于 AI 算法的 360 度实时回放技术。
编辑点评: 体育 IP 与大模型的结合点不在「聊天」,而在把赛事数据、战术语义和球迷互动封装成可对话的服务层——NBA Chat 是千问在垂直场景落地的一次标准样板。
原文:https://www.ithome.com/0/960/548.htm[16]
ICRA 2026 现场:中国军团主导维也纳,具身智能进入深水区
IEEE 国际机器人与自动化会议(ICRA 2026)6 月 1 日至 5 日在奥地利维也纳举行,以「Robots for All」为主题,汇聚 86 个国家和地区超过 8000 名学者与产业人士。本届有效投稿 4947 篇、录用 1882 篇(38.04%),11 所中国高校占 Top 20 的 55%,清华以 74 篇断层第一。现场工业展区几乎被中国展商包场,宇树、千寻智能、智元、加速进化等企业集中亮相。行业叙事已从「大模型」转向「物理智能」:VLA 模型成为核心议题,千寻 Spirit v1.6 在盲测中力压英伟达 Cosmos3 与 Physical Intelligence 的 Pi0.5;灵巧手厂商则普遍以「灵巧手 + 操控数据集 + 触觉传感」成套方案参展,推动从硬件 Demo 到产业化路线的转变。同期,宇树科创板 IPO 获上市委通过、英伟达与宇树合作发布 H2+ 参考设计、OpenAI 宣布 Robotics 团队回归,人形机器人赛道竞争进一步白热化。
编辑点评: ICRA 2026 释放的信号很清晰——具身智能的竞争已从「能不能走」升级到 VLA 大脑、全身操控与触觉闭环的全栈博弈,中国力量正在算法、硬件与数据三条线上同时加压。
原文:https://www.leiphone.com/category/robot/FQ8kbFW5Lq956az4.html[17]
抖音副总裁李亮回应「豆包误判蘑菇致用户中毒」:AI 回答仅供参考
抖音集团副总裁李亮发文回应「豆包误判蘑菇导致用户中毒」事件,称豆包已联系上当事用户。据反馈,用户使用豆包拍照识别小区摘到的蘑菇时,系统识别为「鸡腿菇」,同时在回复中明确提示「极容易和剧毒的大青褶伞混淆,误食会引发严重胃肠炎症状」,并强烈建议不要食用野生蘑菇,强调仅凭图片无法 100% 排除有毒相似种。李亮表示,AI 仍在发展阶段,豆包也在不断提升识别准确性;涉及人身安全的问题,AI 回答仅供参考,务必多方咨询求证。他还提醒,小区内摘到的蘑菇或其他果类即使本身无毒,也可能存在农药残留等风险,同样不建议食用。
编辑点评: 这起事件再次暴露视觉识别在生命安全场景下的边界——模型即便给出风险提示,也无法替代专业鉴定;平台回应的方向正确,但产品层面或许需要在高风险类目上设置更硬的前置拦截。
原文:https://www.ithome.com/0/960/476.htm[18]
程序员愿为 Claude 写文档,却不肯为同事写
博主 Mark Dominus 在「The Universe of Discourse」撰文,回应一个日益普遍的抱怨:程序员乐于为 Claude 撰写详细的 CLAUDE.md 和 PROJECT.md,却对同事吝于动笔。他分享了自己的转变——不再丢弃 Claude 的交接文档,而是在项目结束时让 Claude 从零撰写一份结构化的高层总结,经本人审阅编辑后提交进代码仓库;此前 Claude 还会模仿旧文档格式误加「Approved-by」段落,他已更新 CLAUDE.md 加以约束。Dominus 的建议很直接:让 Claude 写下的笔记和项目总结都入库,成本极低,未来同事或自己用 git grep 或许就能找到关键上下文。
编辑点评: 讽刺背后是一个真实的产品信号——当 AI 成为默认协作者,文档的「受众」从人变成了模型;把 AI 交接物沉淀进仓库,或许比强迫团队写 wiki 更容易落地。
原文:https://blog.plover.com/2026/03/09/#documentation-wins-2[19]
腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍
腾讯混元宣布提出 Stem 稀疏注意力算法,已被机器学习顶会 ICML 2026 收录。该算法从「因果信息流」重新审视块级稀疏,以 Token 位置衰减(TPD)和输出感知度量(OAM)两大创新,在仅使用 25% 算力的情况下逼近稠密注意力精度。配套 HPC 算子库将理论加速比转化为端到端实测性能:在 Hy3 preview(W8A8-FP8)上,128K 上下文场景下首字延迟降低 3.6 倍。官方强调,Stem 算法与 HPC 开源的 Stem+BSA 算子构成全栈加速方案,算法层保精度、算子层兑现硬件收益,更贴近生产环境落地。
编辑点评: 长上下文推理的瓶颈正越来越体现在首 token 延迟而非单次吞吐——Stem 用 25% 算力换近无损精度,对 Agent 和多轮对话场景的实际体验提升可能比 benchmark 分数更有体感。
原文:https://www.ithome.com/0/960/712.htm[20]
以上就是今天的 AI 领域要闻。明天见!
引用链接
[1]https://www.wired.com/story/openai-and-anthropic-may-be-rivals-but-their-investors-arent-choosing-sides/
[2]https://the-decoder.com/anthropic-says-claude-now-writes-over-90-of-its-code-and-wants-the-world-to-have-an-ai-pause-button/
[3]https://www.marktechpost.com/2026/06/05/microsoft-fara-tutorial-run-a-browser-use-agent-in-google-colab-with-a-mock-openai-compatible-endpoint/
[4]https://www.ithome.com/0/960/723.htm
[5]https://www.engadget.com/2188124/openai-will-let-us-government-review-its-models/
[6]https://www.ithome.com/0/960/707.htm
[7]https://www.ithome.com/0/960/695.htm
[8]https://passo.uno/fine-tuning-docs-llm/
[9]https://www.marktechpost.com/2026/06/05/nvidia-ai-releases-dynamo-snapshot-a-criu-based-fast-startup-system-for-ai-inference-on-kubernetes/
[10]https://www.ithome.com/0/960/722.htm
[11]https://www.qbitai.com/2026/06/431027.html
[12]https://www.ithome.com/0/960/412.htm
[13]https://www.theverge.com/podcast/944058/ai-laptop-nvidia-build-gemini-spark-vergecast
[14]https://news.ycombinator.com/item?id=48414869
[15]https://www.qbitai.com/2026/06/431033.html
[16]https://www.ithome.com/0/960/548.htm
[17]https://www.leiphone.com/category/robot/FQ8kbFW5Lq956az4.html
[18]https://www.ithome.com/0/960/476.htm
[19]https://blog.plover.com/2026/03/09/#documentation-wins-2
[20]https://www.ithome.com/0/960/712.htm
夜雨聆风