极AI · 前沿周报

本期周报梳理2026年4月2日-4月9日AI领域的关键进展，聚焦基础技术突破、产品与商业动向、跨行业融合趋势，以及人才的动向与观点，提炼核心信号与战略含义。

以下内容由北京中关村学院信息智能系统自动生成，仅供参考。

01.

极基础

底层范式与方法论演变

本周总结

本周前沿模型竞赛进入新阶段：Anthropic Mythos 和 Meta Muse Spark 接连发布，基准分数持续攀升，但两个趋势值得关注。一是"能力越强、开放越窄"——Mythos 因安全风险不公开发布，前沿能力的商业化路径正在收窄。二是 ARC-AGI-3 基准显示所有顶级模型得分低于 1%，而人类可在数分钟内完成同类任务，基准刷分与通用智能之间的落差仍然显著。与此同时，Anthropic 调整订阅策略不再覆盖第三方工具用量，前沿智能的使用成本正在上升。

Anthropic 发布 Claude Mythos Preview 并启动 Project Glasswing

Anthropic 推出新前沿模型 Claude Mythos Preview，HLE 64.7%、SWE-bench Verified 93.9%、TerminalBench 82%，软件漏洞发现能力超越绝大多数人类、仅次于最顶尖专家。因网络攻击风险，模型不公开发布，仅通过 Project Glasswing 计划向合作伙伴开放用于安全防御。（@alexalbert__、@chetaslua、@bcherny）

2026年04月08日

Meta 超级智能实验室发布首个模型 Muse Spark

Meta Superintelligence Labs 发布首款模型 Muse Spark，原生多模态，支持工具调用、视觉链式思维和多智能体编排。FrontierScience Research 得分 38%，Artificial Analysis 智能指数得分 52 排名第四，token 效率显著优于同级模型。不开源，仅提供 API 预览。（@omarsar0、@EpochAIResearch、@NandoDF、@jack_w_rae）

2026年04月09日

ARC-AGI-3 基准发布，所有前沿模型得分低于 1%

ARC-AGI-3 基准测试 发布，GPT-5、Gemini 3 和 Claude 得分均低于 1%，而人类无需任何说明即可自行摸索出规则（基线得分 100%）。Chollet 指出 基础 LLM 缺乏流体智能已获确认，但推理模型或可解决大部分此类题目。（@fchollet）

Anthropic 宣布 Claude 订阅不再覆盖第三方工具用量

Anthropic 宣布，自 4 月 4 日 起 Claude 订阅将不再覆盖 OpenClaw 等第三方工具的模型用量；用户可通过折扣价额外购买用量包，或改用 Claude API Key 直接接入。（@bcherny）

2026年04月03日

· · ·

02.

极应用

商业模式与产业方向研判

本周总结

当单季融资达到 $2210 亿、头部公司年化收入快速上升时，AI 应用层呈现以下趋势：头部大额融资与早期轮回暖同时出现，说明资金一边继续流向头部平台与算力体系，一边押注支持新场景与新公司；企业侧也在加速从试点转向正式付费，编码、客服、搜索等场景率先形成规模化需求。与此同时，Poke 把 Agent 使用门槛降到“发一条短信”，Luminai在医疗系统把非结构化流程转为可自动化流程，AI落地正从高门槛场景走向更大范围的应用。

Q1 北美 AI 创业融资额达 $2210 亿，早期轮为三年峰值

Crunchbase 数据显示，Q1 2026 北美 AI 创业融资总额达 $2210 亿，约为上季度的 6 倍，头部融资包括 OpenAI $1220 亿、Anthropic Series G $300 亿（估值 $3800 亿）、xAI $200 亿；早期 Series A/B 合计 $251 亿，同比增 56%，为近三年最强早期融资季。（pymnts）

2026年04月06日

Anthropic 年化营收突破 300 亿美元

Anthropic 宣布 年化营收突破 300 亿美元，较 2025 年底 90 亿美元大幅增长。同时与 Google 和 Broadcom 签署 约 3.5 吉瓦下一代 TPU 算力协议，2027 年起上线。另计划主导设立 10 亿美元 PE 合资基金，其中 Anthropic 自身出资 2 亿美元。（@KateClarkTweets、@indigox、@bcherny）

2026年04月07日

a16z 发布：企业AI实际渗透率超预期

a16z 基于内部数据与公开披露发布报告，财富 500 强中 29%、全球 2000 强中约 19%已是领先 AI 初创公司的活跃付费客户。这些企业已签署自上而下的合同，成功将试点转化为正式部署，并在组织内上线产品。采用最快的三大场景为编码（领先一个数量级）、客服支持和搜索，最活跃行业为科技、法律、医疗。（@a16z）

2026年04月08日

Poke 将 AI Agent 使用门槛降至发一条短信

Poke 将 AI Agent 的使用门槛降至 发一条短信——无需安装应用或配置环境，通过 iMessage、SMS 或 Telegram 即可完成日历管理、健康追踪与智能家居控制；相比需要终端安装的 OpenClaw，Poke 专为对技术门槛敏感的普通用户设计。公司已完成共 $2500 万融资，估值 $3 亿。（TechCrunch）

2026年04月08日

Luminai 完成 3800 万美元 B 轮融资，专注医疗系统 AI 工作流自动化

医疗 AI 自动化公司 Luminai 完成 $3800 万 B 轮 融资，专注将大型医疗系统的运营工作流从人工转向自动化，将传真等非结构化数据转为结构化数据并构建 AI Agent 接管关键流程；现有客户已覆盖 Cleveland Clinic 等大型医疗机构。（@ycombinator）

2026年04月09日

· · ·

03.

极交叉

学科交叉与应用前沿

本周总结

AI 在科学研究中的角色正在从“辅助工具”走向“协作研究者”，前沿模型已能在纯数学证明中独立给出研究者未预见的构造路径；但Nielsen的提醒同样重要，AI 在验证回路短的任务上进展更快，在范式突破问题上仍受验证机制约束，单一路径难以覆盖真实科研；Hassabis表示：AI对科学的价值最终要落到可验证、可转化的场景，尤其是健康与药物研发。整体看，交叉领域的重心正在转向“能否在真实科研流程中被验证并持续产出”。

GPT-5.4 Pro 辅助完成马尔可夫链谱间隙数学证明

研究者 Vishesh Jain 和 Clayton Mizgerd 利用 GPT-5.4 Pro 证明了 对称群上相邻转置马尔可夫链的谱间隙极值条件刻画，回答了 Fill 的一个问题。GPT-5.4 Pro 能够一次性生成主要结果的第二部分，其中分段特征向量的构造对作者而言是全新的。（@SebastienBubeck）

Michael Nielsen 探讨 AI 加速科学的验证回路瓶颈

量子计算先驱、Astera Institute 研究员 Michael Nielsen 在 Dwarkesh Podcast 中指出，AI 在编程等紧密验证回路领域优势显著，但广义相对论这类范式突破中 纯梯度下降并不适用；真正的 AI 科学加速需要支持 多元并行研究纲领长期并存，而非仅依赖单一优化路径。（YouTube @DwarkeshPatel）

2026年04月07日

Demis Hassabis 谈 AI 与科学：从 AlphaFold 到新药研发的现实路径

Google DeepMind CEO、诺贝尔奖得主 Demis Hassabis 在 Cleo Abram 的访谈中指出，AlphaFold 解决了“科学史上最重要的未解难题”蛋白质折叠问题，目前正在加速新药研发、核聚变研究与自然灾害预测；他认为 AI 最重要的应用方向是 推进人类健康，而非聊天机器人或图像生成。（YouTube @CleoAbram、@demishassabis）

2026年04月07日

· · ·

04.

人才动态

行业顶尖人才的动向与观点

本周总结

一个值得注意的信号：从 Karpathy 到 LangChain 到 OpenAI 前沿团队，本周多位 AI 领域从业者不约而同地在重新定义"工程"的含义——不再是人写代码、机器执行，而是人定义知识结构、Agent 自主生成和维护整个系统。百万行代码零人工编写已从概念变为现实。当"怎么实现"不再是瓶颈，"实现什么"和"基于什么知识判断"成为真正的竞争壁垒。

Karpathy 提出LLM驱动的个人知识库构建范式

Andrej Karpathy 详述了用 LLM 构建个人知识库的方法：将文档编译为 markdown wiki，通过 LLM 进行问答和增量维护。他进一步提出在 Agent 时代共享 idea file 而非代码的理念，强调基于文件的知识库让用户完全掌控数据并可自由切换 AI。（@karpathy）

2026年04月03日

Harrison Chase：AI代理持续学习可发生在三层——模型、框架、上下文

Harrison Chase 指出，在 Agent 系统中，学习实际可发生在三个不同层面：模型、框架（Harness）和上下文。这一框架揭示 Agent 可通过框架优化和上下文记忆实现高效持续学习，无需每次都重训底层模型，为构建更智能的 Agent 提供了清晰路径。（@hwchase17）

2026年04月05日

Ryan Lopopolo：Harness Engineering 范式，以Agent全程写码构建百万行产品

OpenAI 前沿产品团队 Ryan Lopopolo 提出 Harness Engineering 范式：5 个月 零人工编码 构建逾 100 万行 代码库，代码须面向 AI agent 可读；开源编排工具 Symphony 支持大规模并行 Codex agent，行业焦点已从单次模型效果转向系统可靠性。（Latent Space）

2026年04月08日

Amol Avasare：Anthropic ARR 14 个月增至$190亿背后的增长方法论

Anthropic 增长负责人 Amol Avasare 在 Lenny's Podcast 分享：14 个月内 ARR 从 $10 亿 增至逾 $190 亿，靠 资源押注高杠杆大项目 与 CASH 系统驱动；预判 AI 时代 PM 数量将超过工程师。（Lenny's Podcast）

2026年04月05日

· · ·