
本期周报梳理2026年4月2日-4月9日AI领域的关键进展,聚焦基础技术突破、产品与商业动向、跨行业融合趋势,以及人才的动向与观点,提炼核心信号与战略含义。
以下内容由北京中关村学院信息智能系统自动生成,仅供参考。
01.
极基础
底层范式与方法论演变
本周总结
本周前沿模型竞赛进入新阶段:Anthropic Mythos 和 Meta Muse Spark 接连发布,基准分数持续攀升,但两个趋势值得关注。一是"能力越强、开放越窄"——Mythos 因安全风险不公开发布,前沿能力的商业化路径正在收窄。二是 ARC-AGI-3 基准显示所有顶级模型得分低于 1%,而人类可在数分钟内完成同类任务,基准刷分与通用智能之间的落差仍然显著。与此同时,Anthropic 调整订阅策略不再覆盖第三方工具用量,前沿智能的使用成本正在上升。
Anthropic 发布 Claude Mythos Preview 并启动 Project Glasswing
Anthropic 推出新前沿模型 Claude Mythos Preview,HLE 64.7%、SWE-bench Verified 93.9%、TerminalBench 82%,软件漏洞发现能力超越绝大多数人类、仅次于最顶尖专家。因网络攻击风险,模型不公开发布,仅通过 Project Glasswing 计划向合作伙伴开放用于安全防御。(@alexalbert__、@chetaslua、@bcherny)
2026年04月08日
Meta 超级智能实验室发布首个模型 Muse Spark
Meta Superintelligence Labs 发布首款模型 Muse Spark,原生多模态,支持工具调用、视觉链式思维和多智能体编排。FrontierScience Research 得分 38%,Artificial Analysis 智能指数得分 52 排名第四,token 效率显著优于同级模型。不开源,仅提供 API 预览。(@omarsar0、@EpochAIResearch、@NandoDF、@jack_w_rae)
2026年04月09日
ARC-AGI-3 基准发布,所有前沿模型得分低于 1%
ARC-AGI-3 基准测试 发布,GPT-5、Gemini 3 和 Claude 得分均低于 1%,而人类无需任何说明即可自行摸索出规则(基线得分 100%)。Chollet 指出 基础 LLM 缺乏流体智能已获确认,但推理模型或可解决大部分此类题目。(@fchollet)
Anthropic 宣布 Claude 订阅不再覆盖第三方工具用量
Anthropic 宣布,自 4 月 4 日 起 Claude 订阅将不再覆盖 OpenClaw 等第三方工具的模型用量;用户可通过折扣价额外购买用量包,或改用 Claude API Key 直接接入。(@bcherny)
2026年04月03日
· · ·
02.
极应用
商业模式与产业方向研判
本周总结
当单季融资达到 $2210 亿、头部公司年化收入快速上升时,AI 应用层呈现以下趋势:头部大额融资与早期轮回暖同时出现,说明 资金一边继续流向头部平台与算力体系,一边押注支持新场景与新公司;企业侧也在加速从试点转向正式付费,编码、客服、搜索等场景率先形成规模化需求。与此同时,Poke 把 Agent 使用门槛降到“发一条短信”,Luminai在医疗系统把非结构化流程转为可自动化流程,AI落地正从高门槛场景走向更大范围的应用。
Q1 北美 AI 创业融资额达 $2210 亿,早期轮为三年峰值
Crunchbase 数据显示,Q1 2026 北美 AI 创业融资总额达 $2210 亿,约为上季度的 6 倍,头部融资包括 OpenAI $1220 亿、Anthropic Series G $300 亿(估值 $3800 亿)、xAI $200 亿;早期 Series A/B 合计 $251 亿,同比增 56%,为近三年最强早期融资季。(pymnts)
2026年04月06日
Anthropic 年化营收突破 300 亿美元
Anthropic 宣布 年化营收突破 300 亿美元,较 2025 年底 90 亿美元大幅增长。同时与 Google 和 Broadcom 签署 约 3.5 吉瓦下一代 TPU 算力协议,2027 年起上线。另计划主导设立 10 亿美元 PE 合资基金,其中 Anthropic 自身出资 2 亿美元。(@KateClarkTweets、@indigox、@bcherny)
2026年04月07日
a16z 发布:企业AI实际渗透率超预期
a16z 基于内部数据与公开披露发布报告,财富 500 强中 29%、全球 2000 强中约 19%已是领先 AI 初创公司的活跃付费客户。这些企业已签署自上而下的合同,成功将试点转化为正式部署,并在组织内上线产品。采用最快的三大场景为编码(领先一个数量级)、客服支持和搜索,最活跃行业为科技、法律、医疗。(@a16z)
2026年04月08日
Poke 将 AI Agent 使用门槛降至发一条短信
Poke 将 AI Agent 的使用门槛降至 发一条短信——无需安装应用或配置环境,通过 iMessage、SMS 或 Telegram 即可完成日历管理、健康追踪与智能家居控制;相比需要终端安装的 OpenClaw,Poke 专为对技术门槛敏感的普通用户设计。公司已完成共 $2500 万融资,估值 $3 亿。(TechCrunch)
2026年04月08日
Luminai 完成 3800 万美元 B 轮融资,专注医疗系统 AI 工作流自动化
医疗 AI 自动化公司 Luminai 完成 $3800 万 B 轮 融资,专注将大型医疗系统的运营工作流从人工转向自动化,将传真等非结构化数据转为结构化数据并构建 AI Agent 接管关键流程;现有客户已覆盖 Cleveland Clinic 等大型医疗机构。(@ycombinator)
2026年04月09日
· · ·
03.
极交叉
学科交叉与应用前沿
本周总结
AI 在科学研究中的角色正在 从“辅助工具”走向“协作研究者”,前沿模型已能在纯数学证明中独立给出研究者未预见的构造路径;但Nielsen的提醒同样重要,AI 在验证回路短的任务上进展更快,在范式突破问题上仍受验证机制约束,单一路径难以覆盖真实科研;Hassabis表示:AI对科学的价值最终要落到可验证、可转化的场景,尤其是健康与药物研发。整体看,交叉领域的重心正在转向“能否在真实科研流程中被验证并持续产出”。
GPT-5.4 Pro 辅助完成马尔可夫链谱间隙数学证明
研究者 Vishesh Jain 和 Clayton Mizgerd 利用 GPT-5.4 Pro 证明了 对称群上相邻转置马尔可夫链的谱间隙极值条件刻画,回答了 Fill 的一个问题。GPT-5.4 Pro 能够一次性生成主要结果的第二部分,其中分段特征向量的构造对作者而言是全新的。(@SebastienBubeck)
Michael Nielsen 探讨 AI 加速科学的验证回路瓶颈
量子计算先驱、Astera Institute 研究员 Michael Nielsen 在 Dwarkesh Podcast 中指出,AI 在编程等紧密验证回路领域优势显著,但广义相对论这类范式突破中 纯梯度下降并不适用;真正的 AI 科学加速需要支持 多元并行研究纲领长期并存,而非仅依赖单一优化路径。(YouTube @DwarkeshPatel)
2026年04月07日
Demis Hassabis 谈 AI 与科学:从 AlphaFold 到新药研发的现实路径
Google DeepMind CEO、诺贝尔奖得主 Demis Hassabis 在 Cleo Abram 的访谈中指出,AlphaFold 解决了“科学史上最重要的未解难题”蛋白质折叠问题,目前正在加速新药研发、核聚变研究与自然灾害预测;他认为 AI 最重要的应用方向是 推进人类健康,而非聊天机器人或图像生成。(YouTube @CleoAbram、@demishassabis)
2026年04月07日
· · ·
04.
人才动态
行业顶尖人才的动向与观点
本周总结
一个值得注意的信号:从 Karpathy 到 LangChain 到 OpenAI 前沿团队,本周多位 AI 领域从业者不约而同地在重新定义"工程"的含义——不再是人写代码、机器执行,而是人定义知识结构、Agent 自主生成和维护整个系统。百万行代码零人工编写已从概念变为现实。当"怎么实现"不再是瓶颈,"实现什么"和"基于什么知识判断"成为真正的竞争壁垒。
Karpathy 提出LLM驱动的个人知识库构建范式
Andrej Karpathy 详述了用 LLM 构建个人知识库的方法:将文档编译为 markdown wiki,通过 LLM 进行问答和增量维护。他进一步提出在 Agent 时代共享 idea file 而非代码的理念,强调基于文件的知识库让用户完全掌控数据并可自由切换 AI。(@karpathy)
2026年04月03日
Harrison Chase:AI代理持续学习可发生在三层——模型、框架、上下文
Harrison Chase 指出,在 Agent 系统中,学习实际可发生在三个不同层面:模型、框架(Harness)和上下文。这一框架揭示 Agent 可通过框架优化和上下文记忆实现高效持续学习,无需每次都重训底层模型,为构建更智能的 Agent 提供了清晰路径。(@hwchase17)
2026年04月05日
Ryan Lopopolo:Harness Engineering 范式,以Agent全程写码构建百万行产品
OpenAI 前沿产品团队 Ryan Lopopolo 提出 Harness Engineering 范式:5 个月 零人工编码 构建逾 100 万行 代码库,代码须面向 AI agent 可读;开源编排工具 Symphony 支持大规模并行 Codex agent,行业焦点已从单次模型效果转向系统可靠性。(Latent Space)
2026年04月08日
Amol Avasare:Anthropic ARR 14 个月增至$190亿背后的增长方法论
Anthropic 增长负责人 Amol Avasare 在 Lenny's Podcast 分享:14 个月内 ARR 从 $10 亿 增至逾 $190 亿,靠 资源押注高杠杆大项目 与 CASH 系统驱动;预判 AI 时代 PM 数量将超过工程师。(Lenny's Podcast)
2026年04月05日
· · ·

夜雨聆风