AI 周报 (2026-week-15)

一、本周头条

1. Claude Opus 4.7 深夜发布：视觉能力翻倍，但「不说人话」引发争议

4 月 17 日深夜，Anthropic 发布了 Claude Opus 4.7。这是继上周 Mythos Preview 之后的又一重磅更新，但这次的反响却两极分化。

好消息是，Opus 4.7 在视觉能力上实现了质的飞跃。XBOW 的视觉测试中，4.7 从 4.6 的 54.5% 直接飙升到 98.5%，几乎满分。图像分辨率支持也提升到长边 2576 像素（约 375 万像素），是之前的三倍多。SWE-bench Pro 达到 64.3%，超过 GPT-5.4 的 57.7%。

坏消息是，用户反馈两极分化严重。Reddit 上大量用户吐槽 Opus 4.7 出现「严重倒退」：长上下文检索能力断崖式下跌（1M 上下文准确率从 78.3% 跌至 32.2%）、幻觉增多、自适应推理导致「偷懒」。更让创作者心寒的是，4.7 开始「不说人话」了——那种 GPT 系列标志性的「稳稳接住」「根因」「收口」等 AI 味词汇开始出现在 Claude 的输出中。

技术层面，Opus 4.7 换了新的 tokenizer，相同输入会多消耗 1.0-1.35 倍 Token。虽然官方定价不变（$5/M 输入、$25/M 输出），但实际成本上涨了。Claude Code 之父 Boris Cherny 回应称，MRCR 是「很糟糕的评估方法」，但这并未平息用户的不满。

2. DeepSeek 首次融资 + V4 即将发布：万亿参数 + 华为昇腾，脱离英伟达生态

4 月 18 日，The Information 爆出重磅消息：从不融资的 DeepSeek 正寻求以 100 亿美元估值筹集 3 亿美元。这是梁文锋的重大转变——此前他一直希望保持独立性，多次拒绝国内顶级风投。

更令人期待的是 DeepSeek V4。据多方信息，V4 将是一个万亿参数的 MoE 模型（每个 token 仅激活约 370 亿参数），支持 100 万 token 上下文，并首次支持原生多模态。最关键的是，V4 将运行在华为昇腾芯片上，这将是全球第一个不依赖英伟达的前沿 AI 模型。

老黄本人对此也不淡定，在近期采访中直言这「对美国来说将是一个糟糕的结果」。DeepSeek 近日还在 GitHub 更新了 DeepGEMM，引入了 Mega MoE 架构——把整套 MoE 计算流程融合成一个 mega-kernel，让数据通信和计算同时发生。

3. Claude 强制实名验证 + 半月七次宕机：Anthropic 的算力困局

本周 Anthropic 遭遇了前所未有的信任危机。4 月以来，Claude 已经宕机 7 次，最严重的一次持续 3 小时，6000 人同时在 Downdetector 提交报错。

更让国内用户炸锅的是强制实名验证（KYC）的上线。Anthropic 要求用户提供政府签发的实体证件 + 实时自拍，且明确列出「从不支持地区创建账户」是禁用理由之一。这意味着靠中转、套壳、共享池使用 Claude 的国内账号，几乎没有通过空间。

背后的原因是算力告急。路透曝出 Anthropic 正在探索自研芯片，但从设计到量产需要 3-4 年。在此之前，每一次宕机都在提醒同一件事：你讲的故事够大，但造故事的芯片，都还要看别人脸色。

二、资讯速览

大厂动态

Anthropic

Claude Opus 4.7 发布，视觉能力大幅提升，但长上下文和创作能力遭质疑
上线强制实名验证（KYC），国内用户面临封号风险
4 月以来第 7 次宕机，探索自研芯片但需 3-4 年
Claude Code 重构：支持多 Claude 并行、新增 Routines 功能（定时/API/GitHub 触发）
发布 Cyber Verification Program，为合法安全研究人员开放受限能力
发布「自动化对齐研究员」：9 个 Claude 副本 5 天内在对齐研究任务上碾压人类专家（PGR 0.97 vs 0.23）

OpenAI

发布 GPT-5.4-Cyber，专为网络安全场景微调，支持二进制逆向分析
扩展 TAC（网络安全受信访问）项目，开放给数千名经过验证的安全防御者

DeepSeek

首次寻求外部融资，目标 100 亿美元估值、3 亿美元资金
V4 即将发布：万亿参数 MoE、100 万上下文、原生多模态、华为昇腾芯片
DeepGEMM 更新：引入 Mega MoE、FP4 Indexer，暗示仍在使用英伟达 B 系列训练

Google

Gemini 桌面客户端正式上线 macOS，支持全局快捷键和窗口共享
发布 Memory Caching 技术：让 RNN 拥有「可生长的记忆容量」，解锁超长上下文

智元机器人

定义 2026 为「部署态」元年，发布 XYZ 曲线产业发展框架
龙旗工厂 8 小时直播：精灵 G2 完成 2283 次精密上下料，成功率 99.5%+
万台量产达成，三年营收突破十亿

开源 & 研究

NVIDIA×港大×MIT 发布 Sol-RL：FP4 探索 + BF16 训练，扩散模型训练提速 4.6 倍
谷歌发布 Memory Caching：赋予 RNN「可生长的记忆容量」，兼顾 Transformer 与 RNN 优势
千问开源 Qwen3.6-35B-A3B（350 亿参数，激活 30 亿）

产品 & 工具

Claude Code 桌面端重构：支持多 Claude 并行、内置终端、原生文件编辑
Claude Code Routines 上线：定时/API/GitHub 三路触发，合上电脑也能干活
Gemini macOS 客户端发布：原生 Swift 开发，支持窗口共享和屏幕上下文理解

国内动态

智元 APC 2026 大会：2500 人参会，发布七大生产力解决方案
明日新程（小冰之父李笛创业）连续完成两轮融资，陆奇和李开复罕见同框押注
数据堂斥资打造 8000 平具身智能数据工厂，布局 Ego 众包采集

三、深度洞察

1. Harness Engineering：从「驯服模型」到「驯服 Agent」

本周最值得关注的概念演进，是 Harness Engineering 的全面爆发。

回顾 AI 工程的三次跃迁：2023 年的 Prompt Engineering（怎么问）、2025 年的 Context Engineering（喂什么信息）、2026 年的 Harness Engineering（怎么约束）。每一次跃迁都对应着 AI 角色的升级：聊天机器人 → AI 助手 → 自主 Agent。

OpenAI 2 月发布的博客揭示了一个惊人案例：一个三人工程师小组用 Codex 在五个月内生成了百万行代码，人类手写代码量为 0。人类工程师做的全部工作，就是设计架构边界、制定依赖规则、写自动化测试、配置 lint 规则——这就是 Harness Engineering。

正如卡兹克所言：「Harness 就是控制论，Skill 就是分类学，Prompt 就是语言学，Context 就是信息科学。」从火焰到蒸汽机，人类花了几千年；从 Prompt Engineering 到 Harness Engineering，AI 只花了三年。

2. 具身智能的「部署态」元年：从 Demo 秀到真正干活

智元在 APC 2026 上提出的「部署态」概念，精准戳中了行业痛点。

过去三年，几乎所有机器人公司的叙事都围绕「开发态」展开——比谁的 demo 更炫，比谁的 benchmark 更高。但摩根士丹利调研发现，头部厂商的人形机器人在工厂里的工作效率，大约只有人类的 30%。

智元的 8 小时产线直播是一个标志性事件：无剪辑、无预演、全透明，精灵 G2 完成 2283 次精密上下料，成功率 99.5%+。这不是 demo，是真正的生产力。

更深层的变化是数据范式的转移。从「真机遥操」到「UMI 通用夹爪」再到「Ego 第一人称视频」，每一次迭代都在「解放对采集人的束缚」。数据堂的「大脑+小脑分层、场内+场外双轮驱动」模式，可能是破解「质量与成本」矛盾的答案。

3. AI 公司的「算力焦虑」：从 Anthropic 到 DeepSeek

本周两条看似无关的新闻，实际上指向同一个问题：算力正在成为 AI 公司的生死线。

Anthropic 半月七次宕机、强制实名验证、探索自研芯片——这些动作背后是算力储备告急。OpenAI 内部备忘录的话被印证了：「Anthropic 没能及时储备算力，是一个极大的失误。」

DeepSeek 首次融资同样耐人寻味。从不融资的梁文锋为什么转变？因为 V4 要在华为昇腾上跑，这是一场底层硬件的大迁移。如果成功，它将是全球第一个不依赖英伟达的前沿 AI 模型。

两家公司走了两条完全不同的路：Anthropic 在多云多芯之间周旋，DeepSeek 押注国产芯片。但本质上，它们都在回答同一个问题：在算力成为稀缺资源的时代，谁能掌握自己的命运？

四、值得阅读

Anthropic 自动化对齐研究员 - 9 个 Claude 副本如何在 5 天内碾压人类专家
OpenAI Harness Engineering - 三人团队用 Codex 生成百万行代码的完整方法论
Anthropic Managed Agents 架构 - Agent Harness 的设计哲学
DeepGEMM Mega MoE - DeepSeek 的 MoE 计算优化方案
谷歌 Memory Caching 论文 - 让 RNN 拥有可生长记忆的新方法

引用链接

Anthropic Claude: https://claude.ai/
Anthropic Research: https://www.anthropic.com/research/
OpenAI: https://openai.com/
DeepSeek: https://www.deepseek.com/
DeepGEMM: https://github.com/deepseek-ai/DeepGEMM
Google Gemini: https://gemini.google/
智元机器人: https://www.agibot.com/
数据堂: https://www.datatang.com/
明日新程: https://tuanzi.ai/