AI技术周刊(2026.04.26) 五天五个旗舰模型,Anthropic 估值破万亿: 行业信号最密集的一周-夜雨聆风

AI技术周刊(2026.04.26) 五天五个旗舰模型,Anthropic 估值破万亿: 行业信号最密集的一周

本周，模型发布密度和资本市场的波动同时达到了今年的峰值。4 月 20 日到 24 日，五个旗舰模型相继上线；同一周里，Anthropic 在二级市场被追到接近 1 万亿美元，Cursor 估值几乎翻倍，贝索斯的 Project Prometheus 敲定 100 亿美元新融资。苹果在 15 年后首次换帅，Google 内部成立特别小组追赶 Anthropic 的编码能力，Cohere 收购 Aleph Alpha 把”主权 AI”推到了落地阶段。多条线索同时升温，让这周成为 2026 年至今信号最密集的一周。

模型发布潮：开源与闭源同时换挡

4 月 20 日，Kimi K2.6 开源，主打 300 个子 Agent 并行完成 4000 个协作步骤，长程编码测试中可连续运行 13 小时。同一天，Qwen3.6-Max-Preview 发布，在 Artificial Analysis 智能指数中位列国产第一。22 日，Qwen3.6-27B 开源，这个 27B 参数的稠密多模态模型在 SWE-bench Verified（77.2）和 Terminal-Bench 2.0（59.3）等编程基准上超越了前代 397B MoE 旗舰 Qwen3.5-397B-A17B。

23 日，腾讯混元发布 Hy3 preview，总参数 295B、激活 21B、256K 上下文。这是混元团队 2 月重建预训练和强化学习基础设施后的第一份答卷。腾讯科技给出的解释很直白：300B 量级量化后可单机部署，1T+ 模型必须跨节点，推理单价能差数倍。腾讯云 API 输入最低 1.2 元/百万 tokens、输出最低 4 元/百万 tokens，个人版 Token Plan 28 元/月。模型已在 OpenRouter、OpenClaw 等平台上架。

同日，OpenAI 推出 GPT-5.5，上下文 400K 到 1M token。这次发布会的主题是 “A new class of intelligence for real work”，主推的 benchmark 也明显向真实工作场景倾斜：GDPval（高经济价值知识工作）84.9%、OSWorld-Verified（真实电脑界面操作）78.7%、Tau2-bench Telecom（电信业务流程）98.0%。Anthropic 的 Claude Mythos 在 8 项核心 benchmark 中的 7 项仍领先 GPT-5.5，但 Mythos Preview 定价 25 美元/M 输入、125 美元/M 输出，GPT-5.5 是 5/30，价格只有前者的四分之一到五分之一。per-token latency 与 GPT-5.4 持平，价格翻倍。

24 日，DeepSeek V4 预览版开源。V4-Pro 达到 1.6T 总参、49B 激活，V4-Flash 为 284B/13B，均原生支持 1M 上下文。DeepSeek 第一次同时改动了 Transformer 的三处核心结构：注意力（CSA 压缩稀疏 + HCA 重压缩交替叠用，再加滑动窗口）、残差（升级为 mHC 流形约束超连接）和优化器（Muon 替代 AdamW）。在 1M 上下文下，V4-Pro 单 token 推理 FLOPs 只有 V3.2 的 27%，KV Cache 只有 10%。上下文从 128K 拉到 1M，单 token 算力反而下降。

更值得注意的一个信号是：V4 技术报告 3.1 节明确写，在英伟达 GPU 和华为昇腾 NPU 两个平台上均验证了细粒度专家并行方案。MoE 专家权重和稀疏注意力索引器采用 FP4 精度，正是华为昇腾 950PR 原生支持的 mxFP4 格式。DeepSeek 还在官宣文章中提到，”预计下半年昇腾 950 超节点批量上市并部署之后，Pro 版本的价格也会大幅度下调。”这是国产软硬件协同里少见地写进正式技术报告的版本。

放在一起看，这五个模型释放的信号是：开源模型的供给密度在快速上升，注意力机制的二次复杂度正在被从结构上压下去，而”发布即落地”的路径在国产模型中越来越清晰。

资本市场重新排序

4 月 23 日，新智元援引 Forge Global 等私募二级平台数据：Anthropic 估值已逼近 1 万亿美元，部分卖方报价 1.05 万亿到 1.15 万亿美元，反超 OpenAI（同类平台约 8800 亿美元，略高于其 3 月 8520 亿美元融资估值）。三个月前，Anthropic 最新一级融资估值还在 3800 亿美元，二级市场报价短时间内翻了不止一倍。新智元的判断是，供给收缩叠加需求集中，成长基金、家族办公室和晚期机构同时追逐稀缺筹码。估值跳变的支撑来自两个层面：收入增长决定底部，Claude Code 抬高上限。市场正在把 Anthropic 看作可能占据开发入口的基础设施公司，而非单纯的模型公司。

同一周，Amazon 宣布追投 Anthropic 50 亿美元，累计投资达 130 亿美元。作为交换，Anthropic 承诺未来 10 年在 AWS 上花费超过 1000 亿美元，获得最多 5 GW 计算容量，覆盖 Trainium2 至 Trainium4 芯片。Cursor 则在 4 月 20 日被 techcrunch 报道接近新一轮 20 亿美元融资，估值 500 亿美元（投前），相比 6 个月前 293 亿美元融资后估值几乎翻倍，Thrive、a16z 领投，NVIDIA、Battery 跟投。Cursor 预测 2026 年底实现 60 亿美元年化收入运行率，较今年 2 月的 20 亿翻三倍。

贝索斯旗下 Project Prometheus 在 4 月 21 日被曝即将敲定 100 亿美元新融资，估值 380 亿美元，摩根大通、贝莱德参投。这家公司主攻”理解物理世界”的 AI 模型，落地场景是航空航天和汽车工程制造，叠加 2025 年成立之初的 62 亿美元首轮融资，已是全球资金储备最充裕的早期 AI 公司之一。

国内方面，4 月 19 日 AI 前线连续多篇报道 DeepSeek 启动首次外部融资，估值超 100 亿美元；4 月 22 日智东西援引消息称腾讯、阿里在争投，估值飙至 200 亿美元。机构人士反馈”完全投不进去”。智东西原文当前不可访问，估值数据基于其标题和摘要。

如果把这几笔交易放在一起看，资本对 AI 公司的定价逻辑正在从”模型排名”转向”入口控制 + 商业兑现”。Anthropic 从”模型并跑”被重估为”占据开发入口的基础设施”，Cursor 从”AI 编辑器”变成”AI 编码入口”。二级市场只是更早把这种变化与估值对齐了。

苹果换帅与编码战场的升温

4 月 20 日，苹果官宣库克将出任董事会执行主席，硬件工程高级副总裁约翰·特努斯于 9 月 1 日起接任 CEO。库克 2011 年接手时苹果市值约 3480 亿美元、单季营收不足 300 亿美元；到 2025 财年，市值一度突破 4 万亿美元、年营收超 4160 亿美元、活跃设备超 25 亿台。特努斯 1975 年生，2001 年加入苹果，履历跨越几乎所有硬件产品线。2025 年 4 月，原本属于 AI 团队的机器人业务被划入他主导的硬件部门，被外界视为接任 CEO 的最后铺垫。新核心团队此前已搭建：迈克·洛克威尔接管 Siri，前谷歌 Gemini/DeepMind 的阿马尔·苏布拉曼尼亚负责整体 AI 战略，无屏版 Air 头显预计 2026 年亮相。

编码能力正在成为前沿实验室”自我加速”的核心通道。4 月 21 日，OpenAI 上线 Codex Chronicle 研究预览版，仅 Pro 订阅、仅 Mac。它在后台持续读屏，把打开的文件、浏览的网页、写到一半的文档压缩成个人记忆图谱，下次对话不需要复述上下文。内部代号 “telepathy”。但 The Next Web 报道 Chronicle 并非”本地优先”——截图会上传 OpenAI 服务器、本地记忆未加密；功能更新避开了欧盟、英国和瑞士。

同一天，The Information 报道 Google DeepMind 已组建特别小组专攻编码模型升级，由 Sebastian Borgeaud 领导，谢尔盖·布林和 CTO Koray Kavukcuoglu 直接参与。布林在内部备忘录中写：”为了赢得最后的冲刺，我们必须紧急缩小 Agent 执行的差距，并将我们的模型转变为代码的主要开发者。”对照数据是：Anthropic 的 Boris Cherny 1 月称公司内部”几乎 100%”代码由 AI 编写；Google CFO Anat Ashkenazi 2 月财报会议称 Google 内部约 50%。Brin 在备忘录里直接用了”AI 起飞”这个词。编码不再只是某个产品的特性，AI 写代码的能力越强，AI 研究的迭代速度就越快。

技术信号与事故

4 月 22 日，机器之心报道苹果团队提出一种从 Transformer 到 Mamba 的跨架构蒸馏方法，让 Transformer 模型可以”改装”成线性复杂度推理。与 DeepSeek V4 在注意力内部稀疏化的路径不同，苹果选择用蒸馏切到线性注意力（Mamba 系列），方向一致但方法不同。

混元 Hy3 preview 的工程信号也值得关注。Workbuddy 内测中，Hy3 preview 与国内同尺寸模型的用户盲评胜率达 56%；腾讯文档 AIPPT 场景下，相比 Hy2.0 生成成功率提升 20%、评测得分提升 10%、生成耗时缩短 20%。在科研场景里，GPT-5.5 在 GeneBench 上以明显更少的输出 token 达到更高的准确率，相比 GPT-5.4 把”有效输出”抬得更快。

4 月 25 日，Anthropic 发布 postmortem，承认 Claude Code 过去一段时间”变笨”源于三处 Harness 层优化：3 月 4 日推理强度被默默从”高”降到”中”，4 月 7 日调回；3 月 26 日思考历史清理 bug 导致每轮都在清除上下文，4 月 10 日修复；4 月 16 日系统提示语长度限制导致 3% 性能下降，4 月 20 日撤销。社区反应负面，补偿”重置使用限额”被认为敷衍，postmortem 发布日期撞上 GPT-5.5 发布同日，被疑分散注意力。更有意思的是，Anthropic 内部用 Opus 4.7 反向 code review 才定位到这个 bug——Opus 4.6 没找到，4.7 找到了。”AI 写 AI”的闭环，已经开始在工程层面运行。

4 月 22 日还出现了一则未获官方证实的传闻：多家媒体报道 SpaceX/马斯克”已敲定协议、年内以 600 亿美元收购 Cursor”，与同周 Cursor 自己的 500 亿融资形成两条估值线。Cursor 联合创始人 Michael Truell 在 X 上表态”很高兴能与 SpaceX 团队合作”，但 SpaceX 和 Cursor 双方均未正式确认交易结构。这件事的真假，会改变整张桌面 Agent 的牌局。

主权 AI 的落地

4 月 24 日，Cohere 宣布收购 Aleph Alpha，合并后估值约 200 亿美元。德国零售集团施瓦茨承诺投资 6 亿美元，旗下云平台 STACKIT 作为基础设施底座。柏林政府已计划在公共采购中优先采购该主权 AI 解决方案。双总部（多伦多 + 海德堡）、德国本地数据中心、两国政府背书。作为参照，2025 年 Cohere 估值约 68 亿美元、累计融资 16 亿美元。Aleph Alpha 已于 2024 年 9 月从”自研对标 OpenAI”转向”接入第三方模型的平台”，客户集中在金融、医疗、国防等高监管行业。主权 AI 的逻辑跟硅谷大厂不在同一个赛道：硅谷追求规模、用户、数据飞轮；主权 AI 追求信任、合规、数据本地化。两条路线服务的是不同的用户。

值得继续跟踪的线索

把这周的信息压缩来看，真正值得继续跟踪的不是单条新闻本身，而是几条线是否会在接下来的季度里继续汇合：DeepSeek V4 在真实业务里的口碑能否验证其自我评估（”使用体验优于 Sonnet 4.5、交付质量接近 Opus 4.6 非思考模式”）；GPT-5.5 与 Mythos 的实战对比会如何在企业客户那里分化；Claude 用户流失到 Codex 的趋势能不能止住；Cursor 最终是独立融资还是被并购，定调会改变编码入口的竞争格局。模型能力的差距在收窄，但入口控制和商业兑现的差距，可能才刚刚开始拉开。