【AI早报】OpenAI高管表态|Anthropic与美国政府关系解冻|高通宣布车端人工智能生态计划-夜雨聆风

【AI早报】OpenAI高管表态|Anthropic与美国政府关系解冻|高通宣布车端人工智能生态计划

📋 今日速览

OpenAI 与 Anthropic 虽是死敌，投资者却在两边同时下注
Anthropic 披露：Claude 已编写超九成代码，并呼吁全球设立 AI「暂停按钮」
微软 Fara 教程：在 Google Colab 用模拟 OpenAI 端点跑通浏览器智能体
OpenAI 高管表态：公司将在 AI 模型发布前自愿接受政府审查
OpenAI 将允许美国政府在公开发布前审查其 AI 模型
Anthropic 与美国政府关系解冻：双方正磋商合作
高通宣布车端人工智能 Claw 生态计划，将智能体 AI 引入智能座舱
微调大模型写出「1995 年风格」技术文档的实验
英伟达发布 Dynamo Snapshot：基于 CRIU 的 Kubernetes AI 推理快速启动方案
开源鸿蒙 OpenHarmony 具身智能版本 EmbodiedAI 1.0.1 发布
华为云发布 Agentic AI 系列新品，打造智能时代「硅基黑土地」
马斯克 xAI 开放图转视频预览模型：单图可生成最高 720p 电影感视频
当笔记本遇上 AI：英伟达欲用 AI 芯片重新定义 PC
General Instinct（YC P26）：将前沿大模型压缩部署至边缘设备
智源与清华合作成果登 Science：Brainμ 模型揭示「记忆-睡眠」神经调控机制
NBA 中国携手阿里千问上线首个官方大模型 NBA Chat
ICRA 2026 现场：中国军团主导维也纳，具身智能进入深水区
抖音副总裁李亮回应「豆包误判蘑菇致用户中毒」：AI 回答仅供参考
程序员愿为 Claude 写文档，却不肯为同事写
腾讯混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

OpenAI 与 Anthropic 虽是死敌，投资者却在两边同时下注

尽管 OpenAI 与 Anthropic 在人才、客户与政策议题上针锋相对，两家顶级 AI 实验室的投资人名单却高度重叠。据 Wired 援引 PitchBook 分析，约 42% 的 OpenAI 投资者同时也持有 Anthropic 股份，合计近 90 家风投、对冲基金与资管机构「双押」两家直接竞争对手。Anthropic 最新一轮融资公布的 31 家投资方中，至少 13 家已是 OpenAI 股东，包括红杉、Founders Fund、Iconiq、Insight Partners 等硅谷一线机构。两家估值均逼近万亿美元、年内或先后 IPO，资本选择「对冲押注」而非站队，折射出 AI 赛道烧钱规模之大、回报不确定性之高。也有机构仍保持排他：Khosla、Thrive 只投 OpenAI，Menlo、General Catalyst 只投 Anthropic。[fetch_failed]

编辑点评： 当单一赛道需要数百亿美元级投入时，「忠诚」让位于分散风险；但对创始人而言，共享股东也意味着更难获得排他性资源与战略倾斜。

原文：https://www.wired.com/story/openai-and-anthropic-may-be-rivals-but-their-investors-arent-choosing-sides/^[1]

Anthropic 披露：Claude 已编写超九成代码，并呼吁全球设立 AI「暂停按钮」

Anthropic 旗下研究院首次公布内部数据，称 2026 年第二季度工程师日均代码产出约为 2024 年的八倍，生产环境超 80% 代码由 Claude 生成，若计入脚本与实验代码则超 90%；有员工称已五个月未亲手写码。公司坦承「行数」指标可能高估真实效率，内部调研中位数约为 4 倍提速，且 Claude 所写代码质量已从 2025 年底略逊人类，改善至今日与人类持平，并有望在一年内超越。报告还指出，AI 可自主完成的任务时长约每四个月翻倍，Claude Opus 4.6 已能处理约 12 小时复杂任务。与此同时，Anthropic 警告完全自主的递归自改进尚未实现但可能「比多数机构预期更早到来」，并主张全球应拥有可验证的「暂停或暂缓前沿 AI 开发」选项——仅单一实验室单方面停工意义有限，需多方协同的可核查机制，未来将推动政策界、学界与同业讨论。

编辑点评： 用自家产品加速造下一代模型的叙事，既是对工程能力的展示，也是在监管窗口收紧前，为「可控减速」争取话语主动权。

原文：https://the-decoder.com/anthropic-says-claude-now-writes-over-90-of-its-code-and-wants-the-world-to-have-an-ai-pause-button/^[2]

微软 Fara 教程：在 Google Colab 用模拟 OpenAI 端点跑通浏览器智能体

MarkTechPost 发布实操教程，演示如何在 Google Colab 零 GPU 成本下搭建微软开源项目 Fara 的浏览器操控流程。步骤包括克隆 microsoft/fara 仓库、安装依赖与 Playwright Firefox、编写基于 FastAPI 的 mock OpenAI 兼容 /v1/chat/completions 端点，返回符合 Fara 动作空间的浏览器指令（如 visit_url、terminate），再通过 fara-cli 或 python -m fara.run_fara 驱动智能体完成「打开 example.com 并描述页面」等任务。教程强调先在沙箱环境验证 agent loop 与端点格式，再切换至真实 Fara-7B——可对接 Azure Foundry、vLLM、LM Studio 或 Ollama 等 OpenAI 兼容服务，并提醒避免在真实账号、支付或高风险网站上测试。

编辑点评： 用 mock 端点降低入门门槛是务实做法，也让「浏览器 agent」从论文概念更快落到可复现的 Colab 实验。

原文：https://www.marktechpost.com/2026/06/05/microsoft-fara-tutorial-run-a-browser-use-agent-in-google-colab-with-a-mock-openai-compatible-endpoint/^[3]

OpenAI 高管表态：公司将在 AI 模型发布前自愿接受政府审查

据 CNBC 报道，OpenAI 国家事务负责人乔治·奥斯本确认，公司将遵守美国总统特朗普最新签署的行政命令，在 AI 模型公开发布前允许联邦监管机构评估其能力。该命令旨在建立针对先进人工智能模型的政府审查机制，评估模型的「高级网络能力」，并判定是否应认定为「受监管的前沿模型」——一旦认定，相关模型的分发与销售可能受限。命令在科技行业游说下经历推迟与调整，审查期由原先 90 天缩短至 30 天，并以请求而非强制方式要求企业参与。奥斯本表示，作为前沿实验室，OpenAI 会主动承担安全责任，并建议各国政府设立强有力但保留灵活运作空间的监管机构，公司亦正与美国及其他地区政府部门持续沟通 AI 安全议题。

编辑点评： 「自愿配合」既回应了政治压力，也为后续 IPO 与政企合作铺路；关键仍在于 30 天窗口内审查标准是否清晰、可预期。

原文：https://www.ithome.com/0/960/723.htm^[4]

OpenAI 将允许美国政府在公开发布前审查其 AI 模型

Engadget 援引 CNBC 采访称，OpenAI 宣布将配合特朗普政府关于先进 AI 模型安全监督的新行政命令，在模型向公众发布前接受监管机构能力评估。奥斯本强调民主政府应在 AI 部署中扮演重要角色，同时监管框架需保留足够灵活性。原草案曾要求企业在公开发布前 90 天提交模型并近乎强制参与，但在 David Sacks、马斯克等业界人士警告可能抑制创新后，最终版本将审查期压缩至 30 天，且改为「请求参与」的自愿性质。批评者如弗吉尼亚州众议员 Don Beyer 认为，此举力度不足，未能有效约束潜在危险模型，反而延续了对 AI 开发的「狂野西部」式放任。OpenAI 的表态使其成为明确拥抱该流程的大型实验室之一。

编辑点评： 同一政策的中英文报道角度略有差异，但核心一致：监管从「强制预审」软化为「短期自愿评估」，行业与政府仍在试探平衡点。

原文：https://www.engadget.com/2188124/openai-will-let-us-government-review-its-models/^[5]

Anthropic 与美国政府关系解冻：双方正磋商合作

据路透社报道，Anthropic 与美国特朗普政府之间持续数月的争执已出现缓和迹象。双方关系在今年早些时候因 Anthropic 拒绝允许国防部将其 AI 模型用于国内监控及完全自主武器系统而破裂，美国政府随后将其列为「供应链风险」并纳入国家安全黑名单。自 4 月中旬 CEO 达里奥·阿莫代伊访问白宫商讨合作以来，关系逐步改善；白宫曾邀请其出席 AI 行政命令签署仪式（后因条款调整而取消），Anthropic 亦在 X 上表示期待与白宫合作落实新政。与此同时，Anthropic 仍在法院挑战「供应链风险」认定，国防部亦在积极应诉。知情人士称，Anthropic 已与美国国家网络总监就最强 AI 系统 Mythos 如何保护关键基础设施免受 AI 网络攻击展开讨论。公司正推进上市事宜，但争端未完全解决前，业务所受更广泛影响仍难彻底缓解。

编辑点评： 政策红线与商业扩张之间的拉锯并未结束，「关系解冻」更多体现在对话渠道恢复而非立场根本转变；对 Anthropic 而言，Mythos 网络安全合作或是重建政府信任的突破口。

原文：https://www.ithome.com/0/960/707.htm^[6]

高通宣布车端人工智能 Claw 生态计划，将智能体 AI 引入智能座舱

在 2026 高通汽车技术与合作峰会上，高通技术公司联合诚迈科技、车联天下、斑马智能、德赛西威、镁佳科技、中科创达等生态伙伴，宣布启动车端人工智能 Claw 生态计划。该计划将骁龙数字底盘与高通智能体 AI 运行环境结合，整合各伙伴在座舱、车载操作系统、智能体中间件、AI 应用与量产交付方面的能力，旨在消除下一代汽车智能开发中的碎片化问题，为车企提供从概念验证到量产落地更快速、更集成化的路径。核心能力包括：全天候多模态感知（融合车内外摄像头、音频与车辆状态数据）、支持复杂决策的百亿参数混合专家模型（MoE，可离线运行）、六层车规级安全架构，以及支持持续迭代的 AI 生态。官方称，该计划致力于将 AI 智能体与多模态大模型直接部署到车端，推动汽车从「移动工具」进化为「智能伙伴」。

编辑点评： 车端智能体竞争正从单点功能转向「芯片 + 中间件 + 生态伙伴」的打包交付；Claw 计划若能在安全合规与离线推理之间取得平衡，有望缩短车企从 demo 到量产的周期。

原文：https://www.ithome.com/0/960/695.htm^[7]

微调大模型写出「1995 年风格」技术文档的实验

技术写作博主 Fabrizio Ferri Benedetti 开展了一项风格迁移实验：从 Bitsavers 网站下载微软 1977–2005 年旧版手册 OCR 文本（约 3700 万词），经 Python 清洗与 gemma-4-26b 分类筛选后，构建 19.2 万条 JSONL 训练样本，再通过 Runpod 租用 GPU 对 Llama 3.1 8B Instruct 与 Qwen 2.5 7B Instruct 进行 QLoRA 微调，总成本约 50 美元。测试显示，微调后的 Qwen 模型在文档 malloc()、虚构 ConnectWifi() API 及「用 1990 年代微软风格解释 REST API」等任务中，能产出 Synopsis、Return Value 等时代特征明显的结构；Qwen 192k 全量语料版本表现最强，甚至对 2000 年代概念也能写出类似 Windows 2000 Resource Kit 的章节开篇。作者指出，微调适合风格与语气迁移而非事实检索，参数选择（rank、epoch）对「过度拟合」与「幻觉」影响显著，且无法替代人类技术写作者的判断力。

编辑点评： 这是一条「小成本、强风格」的微调样板：企业若有成体系的内部文档语料，完全可以用类似路径训练专属写作助手；但 rank/epoch 调参与幻觉控制仍是工程门槛。

原文：https://passo.uno/fine-tuning-docs-llm/^[8]

英伟达发布 Dynamo Snapshot：基于 CRIU 的 Kubernetes AI 推理快速启动方案

NVIDIA AI 研究团队推出 Dynamo Snapshot，面向 Kubernetes 上 AI 推理工作负载的 checkpoint/restore 快速启动系统。生产环境中推理副本需弹性扩缩，但冷启动（拉取镜像、加载权重、CUDA 内核预热、图编译、服务注册）常需数分钟，GPU 在此期间空闲却无法服务请求。Dynamo Snapshot 结合 cuda-checkpoint（序列化 GPU 设备状态）与 CRIU（序列化 CPU 侧进程树），通过特权 DaemonSet snapshot-agent 在容器级完成 checkpoint 并写入共享存储，恢复时跳过完整冷启动流程。关键技术包括：在引擎初始化完成、分布式运行时启动前通过 quiesce/resume 钩子 checkpoint；KV cache unmap 将 Qwen3-0.6B 在 B200 上的 checkpoint 从约 190 GiB 降至约 6 GiB；Linux 原生 AIO 与并行 memfd 恢复可将 CRIU 恢复时间最多提速 7.9 倍；GPU Memory Service（GMS）将权重与进程状态解耦，概念验证中 gpt-oss-120b 端到端启动时间可压至 5 秒以内（约 21 倍加速）。当前为 vLLM 限定预览，需 ReadWriteMany 存储与较新 NVIDIA 驱动。

编辑点评： 推理弹性扩缩的瓶颈正在从「算力够不够」转向「副本能不能秒级就绪」；Dynamo Snapshot 把操作系统级 checkpoint 引入 LLM serving，对流量尖峰场景极具实用价值，但特权 DaemonSet 与 TCP 连接状态限制意味着落地仍需运维侧配合。

原文：https://www.marktechpost.com/2026/06/05/nvidia-ai-releases-dynamo-snapshot-a-criu-based-fast-startup-system-for-ai-inference-on-kubernetes/^[9]

开源鸿蒙 OpenHarmony 具身智能版本 EmbodiedAI 1.0.1 发布

在开源鸿蒙开发者大会上，开源鸿蒙具身智能 PMC（筹）委员刘小飞正式公布 EmbodiedAI 1.0.1 版本迭代成果。该版本聚焦机器人控制与智能体应用，持续完善具身智能技术底座，升级导航规划、运动控制、仿真开发、硬件适配等核心能力，并兼容 ROS 生态、主流机器人模拟器及多种本体形态，降低基于开源鸿蒙开发具身智能机器人的门槛。工具生态方面，集成开源鸿蒙原生模拟器、MuJoCo、Gazebo 三大仿真环境，打通从代码开发、仿真调试到真机验证的全流程链路。目前人形机器人、四足机器狗、商用服务机器人等多形态设备已完成适配与功能验证；社区已组建 18 个专项 SIG 工作组协同推进，EmbodiedAI 1.0.1 源码已正式开放。

编辑点评： 具身智能软件栈的竞争正从「单点算法」转向「OS + 仿真 + 真机」全链路；OpenHarmony 押注国产底座与 ROS 兼容并行，能否在生态广度上追上专用机器人框架，取决于 SIG 社区的持续投入与硬件伙伴跟进速度。

原文：https://www.ithome.com/0/960/722.htm^[10]

华为云发布 Agentic AI 系列新品，打造智能时代「硅基黑土地」

6 月 5 日，华为云 INSPIRE 创想者大会在上海开幕。华为云正式提出 Agentic Infra 新范式，围绕「高效 Token 工厂 + 持续学习 + 通智一体化调度 + 安全自治」发布四大基础设施新品：AICS 灵衢智算集群（支持 10 万卡级、200EFLOPS 算力）、AMS Agentic 记忆存储、CCE Volcano Next 通智调度引擎，以及 AgentSphere 安全自治运行环境。同期推出 ModelArts Next 训推平台（含 RL 强化学习、机密推理、模型路由等能力）、公测智果 AgentArts 企业级智能体平台，并贡献开源版 openJiuwen。大会还上线智慧医疗、具身智能、智能制造、科学计算四大「行业 AI 梦工厂」专区，联合智谱、DeepSeek、Minimax 等 20 余家模型厂商发布「百模千态，云聚共赢」生态合作计划。

编辑点评： 华为云此次将 Agentic AI 从概念落到软硬芯一体的基础设施层，Token 工厂、长程记忆与通智调度三条线并进，显示出其押注企业级智能体规模化落地的明确姿态。

原文：https://www.qbitai.com/2026/06/431027.html^[11]

马斯克 xAI 开放图转视频预览模型：单图可生成最高 720p 电影感视频

马斯克旗下 xAI 通过 API 开放预览版图像转视频模型 grok-imagine-video-1.5-preview。用户上传一张静态图片并用自然语言描述运动方式，模型即可生成流畅、带电影感的视频片段，可控制镜头移动、画面节奏、环境氛围与物理效果。官方明确最高支持 720p 输出，虽分辨率不算顶尖，但足以满足概念验证、分镜测试与短内容生产等场景。xAI 还强调该模型适合多镜头序列制作：用户可分别设计各画面、逐段动画化，再串联成更长场景。

编辑点评： 图生视频赛道竞争白热化，xAI 以 API 预览形式快速试水，720p 定位更偏创作者工具而非院线级产出，但多镜头串联能力值得关注。

原文：https://www.ithome.com/0/960/412.htm^[12]

当笔记本遇上 AI：英伟达欲用 AI 芯片重新定义 PC

The Vergecast 本期节目聚焦开发者大会季的一大主题：科技巨头坚信 AI 将彻底改变个人电脑的使用方式。英伟达 CEO 黄仁勋本周描绘了全新的笔记本形态与使用范式，配合微软 Build 与 Google I/O 上亮相的 Gemini Spark、Nvidia RTX Spark、Microsoft Scout 与 Solara 等项目，AI 智能体几乎渗透进各类产品。主持人 Nilay 与 David 讨论核心疑问：用户是否真的需要为运行 AI 模型而彻底重新设计笔记本，还是「更强大的传统笔记本」就已足够？节目还涉及 WWDC 前瞻、Meta 相关话题，以及 Vergecast 改版为日更播客一周来的反馈。

编辑点评： 端侧 AI 硬件叙事再度升温，但消费者是否愿意为「AI 原生笔记本」买单仍是未知数——性能提升与使用场景之间的落差，可能是本轮 PC 复兴的最大考验。

原文：https://www.theverge.com/podcast/944058/ai-laptop-nvidia-build-gemini-spark-vergecast^[13]

General Instinct（YC P26）：将前沿大模型压缩部署至边缘设备

YC P26 创业公司 General Instinct 开源 InstinctRazor 工具，致力于让前沿大模型在机器人等边缘硬件上实际可用。团队将约 245GB 的 Qwen3.5-122B-A10B MoE 模型压缩为 48GiB GGUF 格式，体积小于 Gemma-4-26B-A4B，却在 MMLU-Pro、GPQA-D 等基准上表现更优。核心技术路径是：保留始终激活的路由器、归一化层、Gated-DeltaNet/SSM 层与视觉通路，对路由专家进行更激进的量化，再通过 on-policy 蒸馏恢复量化损失的能力。在「小 GPU」配置下，专家可从系统内存流式加载，8k 上下文窗口时峰值显存仅约 7.6–8GB。团队希望与在机器人及其他边缘设备上部署模型的开发者交流。

编辑点评： 将百GB级 MoE 压到消费级显存可跑，对具身智能与离线机器人场景意义重大；不过社区也质疑其对比基准的选择，实际落地效果仍需更多生产环境验证。

原文：https://news.ycombinator.com/item?id=48414869^[14]

智源与清华合作成果登 Science：Brainμ 模型揭示「记忆-睡眠」神经调控机制

北京智源人工智能研究院与清华大学联合研究发表于《科学》（Science），首次证实睡眠中的记忆重激活参与调控睡眠动态，为「记忆-睡眠」双向作用机制提供新证据。研究发现，睡眠中负向记忆再激活会加剧睡眠碎片化、提升警觉性，正向记忆再激活则增强睡眠连续性与抗干扰能力，推动睡眠从「被动恢复」认知转向受既往经验动态影响的主动过程。研究依托智源自研脑科学多模态基础模型 Brainμ0：其 Brainμ Tokenizer 可将 EEG、双光子钙成像、Neuropixels 等异质神经信号转化为统一 token，在零样本场景下辅助区分「伴随记忆重激活的睡眠」与「非伴随」状态，并支持跨个体、跨场景分析。该模型已在小鼠睡眠自动化分析等真实科研场景中应用，并与华为昇腾完成推理适配优化。

编辑点评： AI for Science 在神经科学基础研究中从「辅助标注」走向「假设验证与因果推断」，Brainμ 在 Science 正刊上的背书，标志着多模态脑科学基础模型开始产出可发表级发现。

原文：https://www.qbitai.com/2026/06/431033.html^[15]

NBA 中国携手阿里千问上线首个官方大模型 NBA Chat

阿里云宣布，NBA 总决赛开赛之际，NBA 中国携手阿里巴巴打造的首个官方大模型「NBA Chat」正式上线，用户可在「NBA 中国」App 中体验。该模型以阿里千问为底座，结合 NBA 丰富的数字资产进行微调，涵盖篮球历史数据与球员深度分析等。目前可为球迷提供智能篮球问答服务，后续将持续升级 Agent 能力——场上战术看不懂可随时拆解，赛后可复盘球员位置、得分等核心数据。2024 年 10 月，阿里巴巴已成为 NBA 中国官方云计算与人工智能合作伙伴；在去年 NBA 中国赛上，阿里云还展示了基于 AI 算法的 360 度实时回放技术。

编辑点评： 体育 IP 与大模型的结合点不在「聊天」，而在把赛事数据、战术语义和球迷互动封装成可对话的服务层——NBA Chat 是千问在垂直场景落地的一次标准样板。

原文：https://www.ithome.com/0/960/548.htm^[16]

ICRA 2026 现场：中国军团主导维也纳，具身智能进入深水区

IEEE 国际机器人与自动化会议（ICRA 2026）6 月 1 日至 5 日在奥地利维也纳举行，以「Robots for All」为主题，汇聚 86 个国家和地区超过 8000 名学者与产业人士。本届有效投稿 4947 篇、录用 1882 篇（38.04%），11 所中国高校占 Top 20 的 55%，清华以 74 篇断层第一。现场工业展区几乎被中国展商包场，宇树、千寻智能、智元、加速进化等企业集中亮相。行业叙事已从「大模型」转向「物理智能」：VLA 模型成为核心议题，千寻 Spirit v1.6 在盲测中力压英伟达 Cosmos3 与 Physical Intelligence 的 Pi0.5；灵巧手厂商则普遍以「灵巧手 + 操控数据集 + 触觉传感」成套方案参展，推动从硬件 Demo 到产业化路线的转变。同期，宇树科创板 IPO 获上市委通过、英伟达与宇树合作发布 H2+ 参考设计、OpenAI 宣布 Robotics 团队回归，人形机器人赛道竞争进一步白热化。

编辑点评： ICRA 2026 释放的信号很清晰——具身智能的竞争已从「能不能走」升级到 VLA 大脑、全身操控与触觉闭环的全栈博弈，中国力量正在算法、硬件与数据三条线上同时加压。

原文：https://www.leiphone.com/category/robot/FQ8kbFW5Lq956az4.html^[17]

抖音副总裁李亮回应「豆包误判蘑菇致用户中毒」：AI 回答仅供参考

抖音集团副总裁李亮发文回应「豆包误判蘑菇导致用户中毒」事件，称豆包已联系上当事用户。据反馈，用户使用豆包拍照识别小区摘到的蘑菇时，系统识别为「鸡腿菇」，同时在回复中明确提示「极容易和剧毒的大青褶伞混淆，误食会引发严重胃肠炎症状」，并强烈建议不要食用野生蘑菇，强调仅凭图片无法 100% 排除有毒相似种。李亮表示，AI 仍在发展阶段，豆包也在不断提升识别准确性；涉及人身安全的问题，AI 回答仅供参考，务必多方咨询求证。他还提醒，小区内摘到的蘑菇或其他果类即使本身无毒，也可能存在农药残留等风险，同样不建议食用。

编辑点评： 这起事件再次暴露视觉识别在生命安全场景下的边界——模型即便给出风险提示，也无法替代专业鉴定；平台回应的方向正确，但产品层面或许需要在高风险类目上设置更硬的前置拦截。

原文：https://www.ithome.com/0/960/476.htm^[18]

程序员愿为 Claude 写文档，却不肯为同事写

博主 Mark Dominus 在「The Universe of Discourse」撰文，回应一个日益普遍的抱怨：程序员乐于为 Claude 撰写详细的 CLAUDE.md 和 PROJECT.md，却对同事吝于动笔。他分享了自己的转变——不再丢弃 Claude 的交接文档，而是在项目结束时让 Claude 从零撰写一份结构化的高层总结，经本人审阅编辑后提交进代码仓库；此前 Claude 还会模仿旧文档格式误加「Approved-by」段落，他已更新 CLAUDE.md 加以约束。Dominus 的建议很直接：让 Claude 写下的笔记和项目总结都入库，成本极低，未来同事或自己用 git grep 或许就能找到关键上下文。

编辑点评： 讽刺背后是一个真实的产品信号——当 AI 成为默认协作者，文档的「受众」从人变成了模型；把 AI 交接物沉淀进仓库，或许比强迫团队写 wiki 更容易落地。

原文：https://blog.plover.com/2026/03/09/#documentation-wins-2^[19]

腾讯混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

腾讯混元宣布提出 Stem 稀疏注意力算法，已被机器学习顶会 ICML 2026 收录。该算法从「因果信息流」重新审视块级稀疏，以 Token 位置衰减（TPD）和输出感知度量（OAM）两大创新，在仅使用 25% 算力的情况下逼近稠密注意力精度。配套 HPC 算子库将理论加速比转化为端到端实测性能：在 Hy3 preview（W8A8-FP8）上，128K 上下文场景下首字延迟降低 3.6 倍。官方强调，Stem 算法与 HPC 开源的 Stem+BSA 算子构成全栈加速方案，算法层保精度、算子层兑现硬件收益，更贴近生产环境落地。

编辑点评： 长上下文推理的瓶颈正越来越体现在首 token 延迟而非单次吞吐——Stem 用 25% 算力换近无损精度，对 Agent 和多轮对话场景的实际体验提升可能比 benchmark 分数更有体感。

原文：https://www.ithome.com/0/960/712.htm^[20]

以上就是今天的 AI 领域要闻。明天见！

引用链接

[1]https://www.wired.com/story/openai-and-anthropic-may-be-rivals-but-their-investors-arent-choosing-sides/

[2]https://the-decoder.com/anthropic-says-claude-now-writes-over-90-of-its-code-and-wants-the-world-to-have-an-ai-pause-button/

[3]https://www.marktechpost.com/2026/06/05/microsoft-fara-tutorial-run-a-browser-use-agent-in-google-colab-with-a-mock-openai-compatible-endpoint/

[4]https://www.ithome.com/0/960/723.htm

[5]https://www.engadget.com/2188124/openai-will-let-us-government-review-its-models/

[6]https://www.ithome.com/0/960/707.htm

[7]https://www.ithome.com/0/960/695.htm

[8]https://passo.uno/fine-tuning-docs-llm/

[9]https://www.marktechpost.com/2026/06/05/nvidia-ai-releases-dynamo-snapshot-a-criu-based-fast-startup-system-for-ai-inference-on-kubernetes/

[10]https://www.ithome.com/0/960/722.htm

[11]https://www.qbitai.com/2026/06/431027.html

[12]https://www.ithome.com/0/960/412.htm

[13]https://www.theverge.com/podcast/944058/ai-laptop-nvidia-build-gemini-spark-vergecast

[14]https://news.ycombinator.com/item?id=48414869

[15]https://www.qbitai.com/2026/06/431033.html

[16]https://www.ithome.com/0/960/548.htm

[17]https://www.leiphone.com/category/robot/FQ8kbFW5Lq956az4.html

[18]https://www.ithome.com/0/960/476.htm

[19]https://blog.plover.com/2026/03/09/#documentation-wins-2

[20]https://www.ithome.com/0/960/712.htm