AI技术周刊(2026.04.26) 五天五个旗舰模型,Anthropic 估值破万亿: 行业信号最密集的一周
本周,模型发布密度和资本市场的波动同时达到了今年的峰值。4 月 20 日到 24 日,五个旗舰模型相继上线;同一周里,Anthropic 在二级市场被追到接近 1 万亿美元,Cursor 估值几乎翻倍,贝索斯的 Project Prometheus 敲定 100 亿美元新融资。苹果在 15 年后首次换帅,Google 内部成立特别小组追赶 Anthropic 的编码能力,Cohere 收购 Aleph Alpha 把”主权 AI”推到了落地阶段。多条线索同时升温,让这周成为 2026 年至今信号最密集的一周。
模型发布潮:开源与闭源同时换挡
4 月 20 日,Kimi K2.6 开源,主打 300 个子 Agent 并行完成 4000 个协作步骤,长程编码测试中可连续运行 13 小时。同一天,Qwen3.6-Max-Preview 发布,在 Artificial Analysis 智能指数中位列国产第一。22 日,Qwen3.6-27B 开源,这个 27B 参数的稠密多模态模型在 SWE-bench Verified(77.2)和 Terminal-Bench 2.0(59.3)等编程基准上超越了前代 397B MoE 旗舰 Qwen3.5-397B-A17B。
23 日,腾讯混元发布 Hy3 preview,总参数 295B、激活 21B、256K 上下文。这是混元团队 2 月重建预训练和强化学习基础设施后的第一份答卷。腾讯科技给出的解释很直白:300B 量级量化后可单机部署,1T+ 模型必须跨节点,推理单价能差数倍。腾讯云 API 输入最低 1.2 元/百万 tokens、输出最低 4 元/百万 tokens,个人版 Token Plan 28 元/月。模型已在 OpenRouter、OpenClaw 等平台上架。
同日,OpenAI 推出 GPT-5.5,上下文 400K 到 1M token。这次发布会的主题是 “A new class of intelligence for real work”,主推的 benchmark 也明显向真实工作场景倾斜:GDPval(高经济价值知识工作)84.9%、OSWorld-Verified(真实电脑界面操作)78.7%、Tau2-bench Telecom(电信业务流程)98.0%。Anthropic 的 Claude Mythos 在 8 项核心 benchmark 中的 7 项仍领先 GPT-5.5,但 Mythos Preview 定价 25 美元/M 输入、125 美元/M 输出,GPT-5.5 是 5/30,价格只有前者的四分之一到五分之一。per-token latency 与 GPT-5.4 持平,价格翻倍。
24 日,DeepSeek V4 预览版开源。V4-Pro 达到 1.6T 总参、49B 激活,V4-Flash 为 284B/13B,均原生支持 1M 上下文。DeepSeek 第一次同时改动了 Transformer 的三处核心结构:注意力(CSA 压缩稀疏 + HCA 重压缩交替叠用,再加滑动窗口)、残差(升级为 mHC 流形约束超连接)和优化器(Muon 替代 AdamW)。在 1M 上下文下,V4-Pro 单 token 推理 FLOPs 只有 V3.2 的 27%,KV Cache 只有 10%。上下文从 128K 拉到 1M,单 token 算力反而下降。
更值得注意的一个信号是:V4 技术报告 3.1 节明确写,在英伟达 GPU 和华为昇腾 NPU 两个平台上均验证了细粒度专家并行方案。MoE 专家权重和稀疏注意力索引器采用 FP4 精度,正是华为昇腾 950PR 原生支持的 mxFP4 格式。DeepSeek 还在官宣文章中提到,”预计下半年昇腾 950 超节点批量上市并部署之后,Pro 版本的价格也会大幅度下调。”这是国产软硬件协同里少见地写进正式技术报告的版本。
放在一起看,这五个模型释放的信号是:开源模型的供给密度在快速上升,注意力机制的二次复杂度正在被从结构上压下去,而”发布即落地”的路径在国产模型中越来越清晰。
资本市场重新排序
4 月 23 日,新智元援引 Forge Global 等私募二级平台数据:Anthropic 估值已逼近 1 万亿美元,部分卖方报价 1.05 万亿到 1.15 万亿美元,反超 OpenAI(同类平台约 8800 亿美元,略高于其 3 月 8520 亿美元融资估值)。三个月前,Anthropic 最新一级融资估值还在 3800 亿美元,二级市场报价短时间内翻了不止一倍。新智元的判断是,供给收缩叠加需求集中,成长基金、家族办公室和晚期机构同时追逐稀缺筹码。估值跳变的支撑来自两个层面:收入增长决定底部,Claude Code 抬高上限。市场正在把 Anthropic 看作可能占据开发入口的基础设施公司,而非单纯的模型公司。
同一周,Amazon 宣布追投 Anthropic 50 亿美元,累计投资达 130 亿美元。作为交换,Anthropic 承诺未来 10 年在 AWS 上花费超过 1000 亿美元,获得最多 5 GW 计算容量,覆盖 Trainium2 至 Trainium4 芯片。Cursor 则在 4 月 20 日被 techcrunch 报道接近新一轮 20 亿美元融资,估值 500 亿美元(投前),相比 6 个月前 293 亿美元融资后估值几乎翻倍,Thrive、a16z 领投,NVIDIA、Battery 跟投。Cursor 预测 2026 年底实现 60 亿美元年化收入运行率,较今年 2 月的 20 亿翻三倍。
贝索斯旗下 Project Prometheus 在 4 月 21 日被曝即将敲定 100 亿美元新融资,估值 380 亿美元,摩根大通、贝莱德参投。这家公司主攻”理解物理世界”的 AI 模型,落地场景是航空航天和汽车工程制造,叠加 2025 年成立之初的 62 亿美元首轮融资,已是全球资金储备最充裕的早期 AI 公司之一。
国内方面,4 月 19 日 AI 前线连续多篇报道 DeepSeek 启动首次外部融资,估值超 100 亿美元;4 月 22 日智东西援引消息称腾讯、阿里在争投,估值飙至 200 亿美元。机构人士反馈”完全投不进去”。智东西原文当前不可访问,估值数据基于其标题和摘要。
如果把这几笔交易放在一起看,资本对 AI 公司的定价逻辑正在从”模型排名”转向”入口控制 + 商业兑现”。Anthropic 从”模型并跑”被重估为”占据开发入口的基础设施”,Cursor 从”AI 编辑器”变成”AI 编码入口”。二级市场只是更早把这种变化与估值对齐了。
苹果换帅与编码战场的升温
4 月 20 日,苹果官宣库克将出任董事会执行主席,硬件工程高级副总裁约翰·特努斯于 9 月 1 日起接任 CEO。库克 2011 年接手时苹果市值约 3480 亿美元、单季营收不足 300 亿美元;到 2025 财年,市值一度突破 4 万亿美元、年营收超 4160 亿美元、活跃设备超 25 亿台。特努斯 1975 年生,2001 年加入苹果,履历跨越几乎所有硬件产品线。2025 年 4 月,原本属于 AI 团队的机器人业务被划入他主导的硬件部门,被外界视为接任 CEO 的最后铺垫。新核心团队此前已搭建:迈克·洛克威尔接管 Siri,前谷歌 Gemini/DeepMind 的阿马尔·苏布拉曼尼亚负责整体 AI 战略,无屏版 Air 头显预计 2026 年亮相。
编码能力正在成为前沿实验室”自我加速”的核心通道。4 月 21 日,OpenAI 上线 Codex Chronicle 研究预览版,仅 Pro 订阅、仅 Mac。它在后台持续读屏,把打开的文件、浏览的网页、写到一半的文档压缩成个人记忆图谱,下次对话不需要复述上下文。内部代号 “telepathy”。但 The Next Web 报道 Chronicle 并非”本地优先”——截图会上传 OpenAI 服务器、本地记忆未加密;功能更新避开了欧盟、英国和瑞士。
同一天,The Information 报道 Google DeepMind 已组建特别小组专攻编码模型升级,由 Sebastian Borgeaud 领导,谢尔盖·布林和 CTO Koray Kavukcuoglu 直接参与。布林在内部备忘录中写:”为了赢得最后的冲刺,我们必须紧急缩小 Agent 执行的差距,并将我们的模型转变为代码的主要开发者。”对照数据是:Anthropic 的 Boris Cherny 1 月称公司内部”几乎 100%”代码由 AI 编写;Google CFO Anat Ashkenazi 2 月财报会议称 Google 内部约 50%。Brin 在备忘录里直接用了”AI 起飞”这个词。编码不再只是某个产品的特性,AI 写代码的能力越强,AI 研究的迭代速度就越快。
技术信号与事故
4 月 22 日,机器之心报道苹果团队提出一种从 Transformer 到 Mamba 的跨架构蒸馏方法,让 Transformer 模型可以”改装”成线性复杂度推理。与 DeepSeek V4 在注意力内部稀疏化的路径不同,苹果选择用蒸馏切到线性注意力(Mamba 系列),方向一致但方法不同。
混元 Hy3 preview 的工程信号也值得关注。Workbuddy 内测中,Hy3 preview 与国内同尺寸模型的用户盲评胜率达 56%;腾讯文档 AIPPT 场景下,相比 Hy2.0 生成成功率提升 20%、评测得分提升 10%、生成耗时缩短 20%。在科研场景里,GPT-5.5 在 GeneBench 上以明显更少的输出 token 达到更高的准确率,相比 GPT-5.4 把”有效输出”抬得更快。
4 月 25 日,Anthropic 发布 postmortem,承认 Claude Code 过去一段时间”变笨”源于三处 Harness 层优化:3 月 4 日推理强度被默默从”高”降到”中”,4 月 7 日调回;3 月 26 日思考历史清理 bug 导致每轮都在清除上下文,4 月 10 日修复;4 月 16 日系统提示语长度限制导致 3% 性能下降,4 月 20 日撤销。社区反应负面,补偿”重置使用限额”被认为敷衍,postmortem 发布日期撞上 GPT-5.5 发布同日,被疑分散注意力。更有意思的是,Anthropic 内部用 Opus 4.7 反向 code review 才定位到这个 bug——Opus 4.6 没找到,4.7 找到了。”AI 写 AI”的闭环,已经开始在工程层面运行。
4 月 22 日还出现了一则未获官方证实的传闻:多家媒体报道 SpaceX/马斯克”已敲定协议、年内以 600 亿美元收购 Cursor”,与同周 Cursor 自己的 500 亿融资形成两条估值线。Cursor 联合创始人 Michael Truell 在 X 上表态”很高兴能与 SpaceX 团队合作”,但 SpaceX 和 Cursor 双方均未正式确认交易结构。这件事的真假,会改变整张桌面 Agent 的牌局。
主权 AI 的落地
4 月 24 日,Cohere 宣布收购 Aleph Alpha,合并后估值约 200 亿美元。德国零售集团施瓦茨承诺投资 6 亿美元,旗下云平台 STACKIT 作为基础设施底座。柏林政府已计划在公共采购中优先采购该主权 AI 解决方案。双总部(多伦多 + 海德堡)、德国本地数据中心、两国政府背书。作为参照,2025 年 Cohere 估值约 68 亿美元、累计融资 16 亿美元。Aleph Alpha 已于 2024 年 9 月从”自研对标 OpenAI”转向”接入第三方模型的平台”,客户集中在金融、医疗、国防等高监管行业。主权 AI 的逻辑跟硅谷大厂不在同一个赛道:硅谷追求规模、用户、数据飞轮;主权 AI 追求信任、合规、数据本地化。两条路线服务的是不同的用户。
值得继续跟踪的线索
把这周的信息压缩来看,真正值得继续跟踪的不是单条新闻本身,而是几条线是否会在接下来的季度里继续汇合:DeepSeek V4 在真实业务里的口碑能否验证其自我评估(”使用体验优于 Sonnet 4.5、交付质量接近 Opus 4.6 非思考模式”);GPT-5.5 与 Mythos 的实战对比会如何在企业客户那里分化;Claude 用户流失到 Codex 的趋势能不能止住;Cursor 最终是独立融资还是被并购,定调会改变编码入口的竞争格局。模型能力的差距在收窄,但入口控制和商业兑现的差距,可能才刚刚开始拉开。
夜雨聆风