本周 3 件大事
# | 事件 | 影响 |
1 | Cerebras 递交 IPO 申请 | AI 芯片战场正式吹响上市号角 |
2 | Cursor 洽谈融资 20 亿美元,估值 500 亿美元 | AI 编程工具进入超级独角兽行列 |
3 | Tesla Robotaxi 服务拓展至达拉斯与休斯顿 | 自动驾驶出租车商业化加速落地 |
模型与产品
AI Agent 推理成本是否也在指数级攀升?
4月15日
一份深度分析指出,当前 AI Agent 每完成一项任务消耗的 token 成本远超普通对话模型,伴随多步推理链路增长,总费用呈现非线性上升趋势。随着 Agent 被广泛部署于代码生成、自动化流程等场景,其推理成本管理正成为企业必须正视的核心挑战。
核心矛盾:当 Agent 任务复杂度翻倍时,成本增幅可达 3-5 倍 |
来源:Toby Ord / Hacker News
Google Gemma 4 实现 iPhone 本地离线 AI 推理
4月15日
Google 宣布 Gemma 4 系列模型可在 iPhone 16 Pro 及更新机型上实现完全离线推理,无需网络连接即可运行端侧大语言模型。这一进展得益于苹果 A18 Pro 芯片的 Neural Engine 性能提升与 Google 的量化压缩技术结合,标志着端侧 AI 能力迈上新台阶。
来源:GizmoWeek / Hacker News
Stanford 报告揭示 AI 圈内圈外日益扩大的认知鸿沟
4月14日
Stanford HAI 发布年度报告,通过大规模问卷与数据分析发现,AI 行业从业者与普通公众在 AI 能力评估、风险认知、发展节奏预期等方面存在显著分歧。圈内人士普遍对 AI 进展持更乐观态度,而圈外公众则对就业冲击、隐私风险和算法偏见表达了更深切的担忧。
来源:TechCrunch / Stanford HAI
Chrome 推出 AI Skills:将常用提示词转化为一键工具
4月15日
Google 在 Chrome 浏览器中引入 AI Skills 功能,允许用户将高频使用的复杂提示词模板保存为可重复调用的一键操作。该功能基于 Chrome 内置的 Gemini Nano 模型,支持在浏览器层面直接执行,无需切换至独立 AI 应用。
来源:Google Blog / Hacker News
OpenAI 发布 Codex Agent SDK:面向企业级自动化
本周
OpenAI 正式推出 Codex Agent SDK,这是一套面向开发者的 Agent 构建框架,支持多步任务编排、沙箱执行与审计追踪。该 SDK 被视为 OpenAI 从对话产品向 AI 基础设施转型的关键一步,同时也对应着本周 Kevin Weil 等高管的离职战略调整。
相关动态:Kevin Weil 与 Bill Peebles 同日宣布离开 OpenAI |
来源:OpenAI Blog / TechCrunch
Anthropic Claude 平台本周出现持续服务中断
4月15日
Anthropic 旗下 Claude.ai、API 接口及 Claude Code 产品于 4 月 15 日起出现异常错误率攀升,影响全球用户正常访问。官方状态页承认问题存在但未披露具体根因。此前一周 Anthropic 正处于与美国政府的供应链风险认定争议之中。
来源:Claude Status / Hacker News
Hugging Face 多模态 Embedding 与 Reranker 模型升级
4月12日
Hugging Face 发布 Sentence Transformers 重大更新,新增对多模态 Embedding 和跨模态 Reranker 的原生支持。新版本支持文本-图像联合检索、视频帧语义匹配等场景,推理速度提升约 40%,为 RAG 应用提供了更强大的向量化基础设施。
来源:Hugging Face Blog
研究进展
TRL v1.0 发布:覆盖完整后训练流程的统一框架
4月12日
Hugging Face 宣布 TRL(Transformer Reinforcement Learning)库正式发布 1.0 版本,该版本整合了从监督微调、奖励建模、PPO 到 DPO、GRPO 等主流训练方法,形成覆盖完整后训练流程的统一 API。v1.0 还引入了分布式训练支持与更完善的实验追踪集成。
来源:Hugging Face Blog
DeepMind Gemini Robotics-ER 1.6:增强具身推理能力
4月12日
Google DeepMind 发布 Gemini Robotics-ER 1.6,在前代基础上大幅提升了机器人在物理环境中的具身推理能力。新版本通过增强的空间理解和因果推理模块,使机器人能够应对更复杂的未见过任务,并显著减少了任务特定微调所需的样本数量。
来源:Google DeepMind Blog
TII Falcon Perception:统一多模态感知架构
4月12日
阿联酋技术创新研究所(TII)发布 Falcon Perception,这是一种统一视觉、语言和音频输入的端到端多模态感知架构。与单独处理各模态的方案不同,Falcon Perception 在单一 transformer 内完成跨模态信息融合,在多项基准上超越了此前的专业单模态模型。
来源:TII / Hugging Face Blog
仅用 165 美元训练跨 25 个物种的 mRNA 语言模型
4月12日
OpenMed 研究团队发布一项低成本 mRNA 语言模型训练方案,利用合成数据和高效微调技术,在 165 美元预算内完成了覆盖 25 个物种的 mRNA 序列预训练模型。该研究证明了小样本高效 AI 在生命科学领域的可行性,为药物发现提供了新的计算工具。
来源:OpenMed / Hugging Face Blog
IBM ALTK-Evolve:Agent 的边用边学框架
4月12日
IBM Research 发布 ALTK-Evolve,这是一种让 AI Agent 在实际任务执行中持续学习和适应的框架。与传统需要离线重新训练的范式不同,ALTK-Evolve 支持 Agent 在生产环境中根据任务反馈实时更新自身知识与策略,降低了模型迭代成本。
来源:IBM Research / Hugging Face Blog
DeepMind SIMA 2:能玩游戏、推理并学习的 AI Agent
4月
DeepMind 发布 SIMA 2,这是其通用 AI Agent 的最新迭代,能够在各种 3D 游戏环境中感知、推理和执行任务。与初代 SIMA 不同,SIMA 2 引入了在线强化学习机制,使其能够从游戏交互中持续改进策略,被视为向通用具身 AI 迈进的重要里程碑。
来源:Google DeepMind Blog
行业与资本
AI 芯片公司 Cerebras 递交 IPO 申请
4月18日
Cerebras Systems 于 4 月 18 日正式向美国证券交易委员会递交首次公开募股文件,计划于 5 月中旬上市。该公司 2025 年营收 5.1 亿美元,净利润 2.378 亿美元,此前已与 Amazon Web Services 达成数据中心芯片供应协议,并与 OpenAI 签署了价值超过 100 亿美元的芯片供应合同。
指标 | 数值 |
2025 年营收 | 5.1 亿美元 |
2025 年净利润 | 2.378 亿美元 |
最新估值 | 230 亿美元 |
最新融资轮次 | 1 月融资 10 亿美元 |
来源:TechCrunch
Cursor 洽谈 20 亿美元融资,估值冲刺 500 亿美元
4月17日
据多个知情人士透露,AI 编程初创公司 Cursor 正与 Thrive、Andreessen Horowitz 等投资方洽谈新一轮超过 20 亿美元的融资,融资前估值达 500 亿美元,较六个月前的 293 亿美元估值接近翻倍。Cursor 预计 2026 年 ARR 将超过 60 亿美元,同时引入自研 Composer 模型后已开始实现小幅正向毛利率。
Nvidia 也参与了这轮投资 |
来源:TechCrunch / Bloomberg
App Store 因 AI 热潮重新繁荣:Q1 新应用发布量同比增长 60%
4月18日
市场研究机构 Appfigures 数据显示,2026 年第一季度全球 App Store 和 Google Play 新应用发布量同比增长 60%,iOS 平台单独增长率更达到 80%。分析认为 AI 降低了应用开发门槛,使大量有创意但缺乏编程能力的开发者得以进入市场,这与此前「AI 将杀死 App」的预测形成鲜明反差。
来源:TechCrunch
全球 RAM 短缺预计持续至 2027 年,AI 算力扩张承压
4月18日
据 Nikkei Asia 报道,尽管内存制造商持续扩产,但预计到 2027 年底全球 DRAM 需求仍将有约 40% 无法被满足。SK 集团董事长更是警告短缺可能延续至 2030 年。这一局面正在推高 HBM 和 DRAM 价格,对 AI 数据中心的算力扩张计划构成直接成本压力。
来源:The Verge
Factory AI 融资后估值达 15 亿美元,专注企业 AI 编程
4月16日
AI 编程初创公司 Factory 宣布完成新一轮融资,估值达到 15 亿美元,正式跻身独角兽行列。该公司专注于为大型企业客户提供定制化 AI 代码生成与维护解决方案,其差异化定位在于深度集成企业现有代码库和工作流,而非面向个人开发者市场。
来源:TechCrunch
政策与治理
Mistral 发布欧洲 AI 发展蓝图:如何在 AI 时代建立欧洲主权
4月13日
法国 AI 初创公司 Mistral 联合欧洲多方利益相关者发布了「European AI」战略白皮书,系统阐述了欧洲在 AI 时代建立技术主权的路径建议。文件涵盖开源模型优先、公共算力基础设施建设、数据本地化与跨境流通机制,以及对 AI 监管框架的修订建议。
来源:Mistral AI Europe / Hacker News
Anthropic 与特朗普政府关系出现转暖迹象
4月18日
尽管 Anthropic 此前被美国国防部列入供应链风险名单,但本周局势出现明显缓和。财政部长 Scott Bessent 与白宫幕僚长 Susie Wiles 于周五会见了 Anthropic 首席执行官 Dario Amodei,白宫发言人称会面「富有成效」,双方就网络安全、AI 安全及美国在 AI 竞赛中的领导地位等议题展开了建设性讨论。
来源:TechCrunch / Axios
OpenAI 呼吁对自动化劳动征税并建立 AI 公共财富基金
本周
OpenAI 发布 13 页政策备忘录,提出智能时代的产业政策建议,包括对自动化劳动征税以补贴受 AI 冲击的劳动者、设立公共财富基金让全体公民分享 AI 发展收益、要求 AI 数据中心承担自身能源成本,以及加强劳动者在 AI 部署决策中的话语权。
来源:New York Post / Qazinform
安全与地缘
Anthropic 对五角大楼供应链风险认定发起上诉
4月18日
Anthropic 对美国国防部将其列入供应链风险名单的认定提起上诉,争议核心在于 Anthropic 拒绝允许其 AI 模型被用于自主武器系统和国内大规模监控场景。公司联合创始人 Jack Clark 表示这仅是一场「窄义的采购争议」,不会影响其向政府提供模型安全简报的合作意愿。
来源:TechCrunch
AI 网络安全防护正演变为一场"工作量证明"军备竞赛
4月16日
多位安全研究人员指出,随着 AI 被广泛应用于漏洞发现、钓鱼攻击生成和自动化渗透测试,网络安全防御方和攻击方都在利用 AI 提升效率,形成了一种以计算资源消耗换取安全边界的"工作量证明"式竞争格局。防御方需要持续投入大量 GPU 算力进行威胁模拟和安全测试。
来源:antirez.com / Hacker News
OpenAI Kevin Weil 和 Bill Peebles 相继离职
4月17日
OpenAI 首席产品官 Kevin Weil 和 Sora 视频生成模型负责人 Bill Peebles 于同一天宣布离职。Weil 曾主导 OpenAI for Science 项目,该项目在发布 GPT-Rosalind 后被并入其他研究团队;Peebles 此前负责的 Sora 服务已于上月关闭,据悉每日计算成本高达百万美元。
来源:TechCrunch
编辑手记 本周的关键词是"转向"。从 Cerebras 冲刺 IPO、Cursor 估值翻番,到 OpenAI 高管接连离职和企业 AI 政策白皮书出炉,AI 行业正经历一场深刻的战略重心迁移:从疯狂扩张模型能力转向精打细算的商业落地。与此同时,Anthropic 与美国政府的博弈进入新阶段,暗示 AI 安全的政治化正在加速。 |
夜雨聆风