一、本周头条
1. Claude Opus 4.7 深夜发布:视觉能力翻倍,但「不说人话」引发争议
4 月 17 日深夜,Anthropic 发布了 Claude Opus 4.7。这是继上周 Mythos Preview 之后的又一重磅更新,但这次的反响却两极分化。
好消息是,Opus 4.7 在视觉能力上实现了质的飞跃。XBOW 的视觉测试中,4.7 从 4.6 的 54.5% 直接飙升到 98.5%,几乎满分。图像分辨率支持也提升到长边 2576 像素(约 375 万像素),是之前的三倍多。SWE-bench Pro 达到 64.3%,超过 GPT-5.4 的 57.7%。
坏消息是,用户反馈两极分化严重。Reddit 上大量用户吐槽 Opus 4.7 出现「严重倒退」:长上下文检索能力断崖式下跌(1M 上下文准确率从 78.3% 跌至 32.2%)、幻觉增多、自适应推理导致「偷懒」。更让创作者心寒的是,4.7 开始「不说人话」了——那种 GPT 系列标志性的「稳稳接住」「根因」「收口」等 AI 味词汇开始出现在 Claude 的输出中。
技术层面,Opus 4.7 换了新的 tokenizer,相同输入会多消耗 1.0-1.35 倍 Token。虽然官方定价不变($5/M 输入、$25/M 输出),但实际成本上涨了。Claude Code 之父 Boris Cherny 回应称,MRCR 是「很糟糕的评估方法」,但这并未平息用户的不满。
2. DeepSeek 首次融资 + V4 即将发布:万亿参数 + 华为昇腾,脱离英伟达生态
4 月 18 日,The Information 爆出重磅消息:从不融资的 DeepSeek 正寻求以 100 亿美元估值筹集 3 亿美元。这是梁文锋的重大转变——此前他一直希望保持独立性,多次拒绝国内顶级风投。
更令人期待的是 DeepSeek V4。据多方信息,V4 将是一个万亿参数的 MoE 模型(每个 token 仅激活约 370 亿参数),支持 100 万 token 上下文,并首次支持原生多模态。最关键的是,V4 将运行在华为昇腾芯片上,这将是全球第一个不依赖英伟达的前沿 AI 模型。
老黄本人对此也不淡定,在近期采访中直言这「对美国来说将是一个糟糕的结果」。DeepSeek 近日还在 GitHub 更新了 DeepGEMM,引入了 Mega MoE 架构——把整套 MoE 计算流程融合成一个 mega-kernel,让数据通信和计算同时发生。
3. Claude 强制实名验证 + 半月七次宕机:Anthropic 的算力困局
本周 Anthropic 遭遇了前所未有的信任危机。4 月以来,Claude 已经宕机 7 次,最严重的一次持续 3 小时,6000 人同时在 Downdetector 提交报错。
更让国内用户炸锅的是强制实名验证(KYC)的上线。Anthropic 要求用户提供政府签发的实体证件 + 实时自拍,且明确列出「从不支持地区创建账户」是禁用理由之一。这意味着靠中转、套壳、共享池使用 Claude 的国内账号,几乎没有通过空间。
背后的原因是算力告急。路透曝出 Anthropic 正在探索自研芯片,但从设计到量产需要 3-4 年。在此之前,每一次宕机都在提醒同一件事:你讲的故事够大,但造故事的芯片,都还要看别人脸色。
二、资讯速览
大厂动态
Anthropic
- Claude Opus 4.7 发布,视觉能力大幅提升,但长上下文和创作能力遭质疑
- 上线强制实名验证(KYC),国内用户面临封号风险
- 4 月以来第 7 次宕机,探索自研芯片但需 3-4 年
- Claude Code 重构:支持多 Claude 并行、新增 Routines 功能(定时/API/GitHub 触发)
- 发布 Cyber Verification Program,为合法安全研究人员开放受限能力
- 发布「自动化对齐研究员」:9 个 Claude 副本 5 天内在对齐研究任务上碾压人类专家(PGR 0.97 vs 0.23)
OpenAI
- 发布 GPT-5.4-Cyber,专为网络安全场景微调,支持二进制逆向分析
- 扩展 TAC(网络安全受信访问)项目,开放给数千名经过验证的安全防御者
DeepSeek
- 首次寻求外部融资,目标 100 亿美元估值、3 亿美元资金
- V4 即将发布:万亿参数 MoE、100 万上下文、原生多模态、华为昇腾芯片
- DeepGEMM 更新:引入 Mega MoE、FP4 Indexer,暗示仍在使用英伟达 B 系列训练
- Gemini 桌面客户端正式上线 macOS,支持全局快捷键和窗口共享
- 发布 Memory Caching 技术:让 RNN 拥有「可生长的记忆容量」,解锁超长上下文
智元机器人
- 定义 2026 为「部署态」元年,发布 XYZ 曲线产业发展框架
- 龙旗工厂 8 小时直播:精灵 G2 完成 2283 次精密上下料,成功率 99.5%+
- 万台量产达成,三年营收突破十亿
开源 & 研究
- NVIDIA×港大×MIT 发布 Sol-RL:FP4 探索 + BF16 训练,扩散模型训练提速 4.6 倍
- 谷歌发布 Memory Caching:赋予 RNN「可生长的记忆容量」,兼顾 Transformer 与 RNN 优势
- 千问开源 Qwen3.6-35B-A3B(350 亿参数,激活 30 亿)
产品 & 工具
- Claude Code 桌面端重构:支持多 Claude 并行、内置终端、原生文件编辑
- Claude Code Routines 上线:定时/API/GitHub 三路触发,合上电脑也能干活
- Gemini macOS 客户端发布:原生 Swift 开发,支持窗口共享和屏幕上下文理解
国内动态
- 智元 APC 2026 大会:2500 人参会,发布七大生产力解决方案
- 明日新程(小冰之父李笛创业)连续完成两轮融资,陆奇和李开复罕见同框押注
- 数据堂斥资打造 8000 平具身智能数据工厂,布局 Ego 众包采集
三、深度洞察
1. Harness Engineering:从「驯服模型」到「驯服 Agent」
本周最值得关注的概念演进,是 Harness Engineering 的全面爆发。
回顾 AI 工程的三次跃迁:2023 年的 Prompt Engineering(怎么问)、2025 年的 Context Engineering(喂什么信息)、2026 年的 Harness Engineering(怎么约束)。每一次跃迁都对应着 AI 角色的升级:聊天机器人 → AI 助手 → 自主 Agent。
OpenAI 2 月发布的博客揭示了一个惊人案例:一个三人工程师小组用 Codex 在五个月内生成了百万行代码,人类手写代码量为 0。人类工程师做的全部工作,就是设计架构边界、制定依赖规则、写自动化测试、配置 lint 规则——这就是 Harness Engineering。
正如卡兹克所言:「Harness 就是控制论,Skill 就是分类学,Prompt 就是语言学,Context 就是信息科学。」从火焰到蒸汽机,人类花了几千年;从 Prompt Engineering 到 Harness Engineering,AI 只花了三年。
2. 具身智能的「部署态」元年:从 Demo 秀到真正干活
智元在 APC 2026 上提出的「部署态」概念,精准戳中了行业痛点。
过去三年,几乎所有机器人公司的叙事都围绕「开发态」展开——比谁的 demo 更炫,比谁的 benchmark 更高。但摩根士丹利调研发现,头部厂商的人形机器人在工厂里的工作效率,大约只有人类的 30%。
智元的 8 小时产线直播是一个标志性事件:无剪辑、无预演、全透明,精灵 G2 完成 2283 次精密上下料,成功率 99.5%+。这不是 demo,是真正的生产力。
更深层的变化是数据范式的转移。从「真机遥操」到「UMI 通用夹爪」再到「Ego 第一人称视频」,每一次迭代都在「解放对采集人的束缚」。数据堂的「大脑+小脑分层、场内+场外双轮驱动」模式,可能是破解「质量与成本」矛盾的答案。
3. AI 公司的「算力焦虑」:从 Anthropic 到 DeepSeek
本周两条看似无关的新闻,实际上指向同一个问题:算力正在成为 AI 公司的生死线。
Anthropic 半月七次宕机、强制实名验证、探索自研芯片——这些动作背后是算力储备告急。OpenAI 内部备忘录的话被印证了:「Anthropic 没能及时储备算力,是一个极大的失误。」
DeepSeek 首次融资同样耐人寻味。从不融资的梁文锋为什么转变?因为 V4 要在华为昇腾上跑,这是一场底层硬件的大迁移。如果成功,它将是全球第一个不依赖英伟达的前沿 AI 模型。
两家公司走了两条完全不同的路:Anthropic 在多云多芯之间周旋,DeepSeek 押注国产芯片。但本质上,它们都在回答同一个问题:在算力成为稀缺资源的时代,谁能掌握自己的命运?
四、值得阅读
- Anthropic 自动化对齐研究员 - 9 个 Claude 副本如何在 5 天内碾压人类专家
- OpenAI Harness Engineering - 三人团队用 Codex 生成百万行代码的完整方法论
- Anthropic Managed Agents 架构 - Agent Harness 的设计哲学
- DeepGEMM Mega MoE - DeepSeek 的 MoE 计算优化方案
- 谷歌 Memory Caching 论文 - 让 RNN 拥有可生长记忆的新方法
引用链接
- Anthropic Claude: https://claude.ai/
- Anthropic Research: https://www.anthropic.com/research/
- OpenAI: https://openai.com/
- DeepSeek: https://www.deepseek.com/
- DeepGEMM: https://github.com/deepseek-ai/DeepGEMM
- Google Gemini: https://gemini.google/
- 智元机器人: https://www.agibot.com/
- 数据堂: https://www.datatang.com/
- 明日新程: https://tuanzi.ai/
夜雨聆风