AI 早报 2026-04-17
概览
要闻
Anthropic 发布 Claude Opus 4.7:代码与长任务能力全面升级
模型发布
阿里通义开源 Qwen3.6-35B-A3B:3B 激活的 Agent 编程稀疏 MoE 腾讯混元开源 HY-World 2.0:单图/文字生成可编辑 3D 世界 Google Gemini 3.1 Flash TTS:支持 audio tags 的可控语音 OpenAI 发布 GPT-Rosalind:面向生命科学研究的前沿推理模型
开发生态
OpenAI Codex 大升级:Computer Use、内置浏览器、图像生成、长期任务 Anthropic 为 Claude Code 开发者发布专属推文账号 @ClaudeDevs Cursor 原生支持 Opus 4.7,限时 50% 折扣 Vercel Workflows 正式 GA:代码即编排器的长任务基础设施 CC v2.1.112 / Codex 0.122.0-alpha / LangChain Core 1.3.0a3
产品应用
Perplexity Personal Computer for Mac 全面开放,默认 Opus 4.7 Replit Agent 4 内置 Opus 4.7,同步限时 5 折 Apple 把不到 200 名 Siri 工程师送去学 Claude Code / Codex Adobe Firefly AI Assistant:把创意套件变成聊天机器人
行业动态
💰 CoreWeave 本周连签 Meta、Anthropic、Jane Street 三笔大单 💰 OpenAI 推出 Trusted Access for Cyber + $10M API 赞助,搭配 GPT-5.4-Cyber
前瞻与传闻
Anthropic 暗示 "Mythos" 为下一代内部模型,Opus 4.7 为缓冲版
🎙 本周推荐播客
Why Claude Feels Different (And What That Means for AI) | The a16z Show The GPT Moment for Robotics Is Here Episode 16: Building AI for Life Sciences Jensen Huang – Will Nvidia's moat persist? The AI Model Built for What LLMs Can't Do AI in the AM: RL for EE, Oversight w/out Nationalization, & the first AI-Run Retail Store The Early Days of Anthropic & How 21 of 22 VCs Rejected It | Anj Midha
要闻
Anthropic 发布 Claude Opus 4.7:代码与长任务能力全面升级
Anthropic 今日正式发布 Claude Opus 4.7,定位为迄今最强的 Opus 模型,核心升级集中在复杂软件工程、长时间自主任务执行与图像/视觉推理;价格与 4.6 持平(输入 $5/M、输出 $25/M),已同步上架 Claude 产品、API、Bedrock、Vertex、Foundry,并被 Cursor、Replit Agent 4、Perplexity Personal Computer 第一时间接入为默认模型。
能力变化:编码基准提升约 13%,生产任务解决率声称为 4.6 的 3 倍,自我验证后再汇报结果
视觉升级:支持最长边 2576 像素高分辨率图片、新分词器保留高频细节
工具面:Claude Code 新增 /ultra-review命令,推理等级新增 xhigh(介于 high 与 max 之间),Max 订阅开放 auto-approve
安全立场:刻意下调网络攻击相关能力,并加入高风险 cyber 请求的自动检测防护
https://www.anthropic.com/news/claude-opus-4-7
模型发布
阿里通义开源 Qwen3.6-35B-A3B:3B 激活的 Agent 编程稀疏 MoE
阿里通义实验室开源 Qwen3.6-35B-A3B,采用 Apache 2.0 协议:总参数 35B、激活 3B 的稀疏 MoE,声称在 Agent 编程上可对标激活规模 10 倍于它的模型,具备多模态感知/推理与思考/非思考双模式。HuggingFace、ModelScope 已上权重,API(Qwen3.6-Flash)即将上线百炼。
定位:低成本 Agent 编程与多模态推理,官方 RefCOCO 92.0
生态:可直接接入 OpenClaw、Claude Code、Qwen Code 等第三方 Agent CLI
开源协议:Apache 2.0,允许商用
https://x.com/Alibaba_Qwen/status/2044768734234243427
腾讯混元开源 HY-World 2.0:单图/文字生成可编辑 3D 世界
腾讯混元发布并开源 HY-World 2.0:多模态世界模型,支持从文本、图像、视频生成和重建 3D 世界,导出 Mesh/3DGS/点云等格式,直接对接 Blender、Unity、Unreal、Isaac Sim。与 Genie 3/Cosmos 的像素级视频路径不同,HY-World 2.0 输出的是可编辑、持久化的 3D 资产。
两大能力:世界生成(文本/单图→3D)和世界重建(多视图/视频→3D)
交互:第一/第三人称自由探索,带基于物理的碰撞
面向场景:游戏关卡原型、具身智能仿真训练
https://github.com/Tencent-Hunyuan/HY-World-2.0
Google Gemini 3.1 Flash TTS:支持 audio tags 的可控语音
Google 发布 Gemini 3.1 Flash TTS,主打 audio tags——在文本中内嵌
[excitement]、[explanatory]这类自然语言标签,即可在同一句话里切换情感、语速、语调;支持 70+ 语言(24 种评估为高质量)。
控制方式:标签与正文混排,无需额外参数,可替代 SSML
语言覆盖:含日语、印地语、阿拉伯语等 70+ 语言
https://x.com/GoogleAI/status/2044447560384102592
OpenAI 发布 GPT-Rosalind:面向生命科学研究的前沿推理模型
OpenAI 今日发布 GPT-Rosalind,定位为"面向生命科学的前沿推理模型",专为药物发现、基因组学分析、蛋白质推理与科学研究工作流加速而设计。这是 OpenAI 继 GPT-5 主模型线之后,首个显式面向科学领域的前沿模型分支。
任务领域:药物发现、基因组分析、蛋白质结构/功能推理、实验设计
命名来源:致敬 Rosalind Franklin(DNA 结构关键贡献者),定位"科学 AI 助手"
战略意义:OpenAI 开始把前沿模型按领域分叉(Cyber、Rosalind、主线),而非单一通用模型
https://openai.com/index/introducing-gpt-rosalind
开发生态
OpenAI Codex 大升级:Computer Use、内置浏览器、图像生成、长期任务
OpenAI 将 Codex 从"编程 agent"扩展为"通用 Mac 工作助手":新版可直接用鼠标/键盘操作 Mac 应用(computer use),带独立指针、可与用户并行多 agent;内置应用内浏览器(来自 Atlas 技术栈),支持 DOM 级评论反馈;集成图像生成/编辑/GIF;新增 90+ 插件(GitHub、JIRA、Slack 等)、长期记忆与计划任务自动化。
Computer Use:自己操作 Mac 应用,不打扰用户本地操作
In-app browser:直接点选网页元素作为上下文喂给 agent
Ongoing tasks:跨日/跨周的计划任务自动执行
插件生态:一次新增 90+ 第三方插件
https://openai.com/index/introducing-upgrades-to-codex/
Anthropic 为 Claude Code 开发者发布专属推文账号 @ClaudeDevs
Anthropic 建立独立的 @ClaudeDevs 账号,作为 Claude 开发者直接获取 changelog、API 发布、社区更新的单一来源,以配合 Opus 4.7 与 Claude Code 持续加速的发布节奏。
定位:面向 builder 的变更日志 + API 更新 + 社区动态
节奏信号:Anthropic 当前在 push desktop app + Opus 4.7 + Routines + Auto mode,更新频率高到需要独立频道
https://x.com/alexalbert__/status/2044790979820183721
Cursor 原生支持 Opus 4.7,限时 50% 折扣
Cursor 在 Opus 4.7 上线后 <1 小时内完成集成,并推出限时 50% 折扣;官方描述为 "impressively autonomous、reasoning 更有创造性"。
速度:与 Anthropic 发布同步
折扣:限时 50%,具体时长未披露
https://x.com/cursor_ai/status/2044785960899236341
Vercel Workflows 正式 GA:代码即编排器的长任务基础设施
Vercel Workflows 宣布 GA:让开发者用自己的代码作为 orchestrator,无需管理队列、重试、worker,就能部署 agents、backends 或任意长时任务。
定位:与 Temporal、Inngest、AWS Step Functions 同一生态位
卖点:retries/queues/workers 下沉,代码即状态机
https://x.com/vercel/status/2044850971185213495
CC v2.1.112 / Codex 0.122.0-alpha / LangChain Core 1.3.0a3
Claude Code 今日连发 v2.1.110 → v2.1.112 三版,Codex 推出 Rust 0.121.0 正式版和 0.122.0-alpha 预览版(匹配桌面大更新),LangChain Core 进入 1.3.0 alpha 系列。
Claude Code:今日 2 次 patch,昨日 1 次 patch
Codex Rust:0.121 正式版今日配合产品大更新上架
LangChain:核心库准备 1.3 大版本,目前还在 alpha
https://github.com/anthropics/claude-code/releases
产品应用
Perplexity Personal Computer for Mac 全面开放,默认 Opus 4.7
Perplexity 把去年 3 月预告的 Personal Computer 正式推给所有 Max 订阅者和 waitlist 用户:在 Mac 上作为多模型编排层,跨本地文件、原生应用、connectors 和 web 跑长时/连续任务,并宣布 Claude Opus 4.7 成为该产品的默认编排模型。
作用域:本地文件 + 原生 app + connectors + web 统一编排
默认模型:Claude Opus 4.7
定价:Perplexity Max($200/月)订阅包含
https://www.perplexity.ai/hub/blog/personal-computer-is-here
Replit Agent 4 内置 Opus 4.7,同步限时 5 折
Replit Agent 4 在 Opus 4.7 上线当日完成底层模型升级,并推出限时 50% 折扣,组合无限画布 + 并行 agent + Opus 4.7 三件套。
https://x.com/Replit/status/2044838078792286290
Apple 把不到 200 名 Siri 工程师送去学 Claude Code / Codex
Apple 启动"AI coding bootcamp",将少于 200 名 Siri 工程师分批送入多周课程,学习如何使用 Anthropic Claude Code 和 OpenAI Codex 等 AI 编码工具——这是罕见的"大厂主动承认 agent-first 工作流已成为必修课"的信号。
规模:<200 名工程师,Siri 团队为主
课程内容:Claude Code + Codex 使用范式
战略含义:苹果官方承认 AI 辅助编码已超越生产力工具边界
https://the-decoder.com/apple-sends-siri-developers-to-ai-coding-bootcamp/
Adobe Firefly AI Assistant:把创意套件变成聊天机器人
Adobe 发布 Firefly AI Assistant,跨 Photoshop、Premiere 等多个应用提供统一的 AI agent 对话界面,可代替用户在不同 app 间穿梭执行创意工作流。
https://the-decoder.com/adobe-turns-its-creative-suite-into-a-chatbot-with-the-new-firefly-ai-assistant/
行业动态
💰 CoreWeave 本周连签 Meta、Anthropic、Jane Street 三笔大单
一周之内 CoreWeave 公布三份重磅协议:Meta 将承诺扩到累计约 $35B(用于 Muse Spark 推理扩容),与 Anthropic 签订多年 Claude 基础设施合作,Jane Street 签 $6B 云服务并以 $109/股注资 $1B 股权;三家都获得 NVIDIA Vera Rubin 平台早期使用权。
金额:Meta ~$35B cumulative、Jane Street $6B + $1B equity、Anthropic 未披露
硬件:NVIDIA Vera Rubin 下一代平台早期部署
信号:推理算力合同成为新一轮 AI infra 竞赛核心
https://www.coreweave.com/news/jane-street-signs-6-billion-ai-cloud-agreement-with-coreweave
💰 OpenAI 推出 Trusted Access for Cyber + $10M API 赞助,搭配 GPT-5.4-Cyber
OpenAI 发布 Trusted Access for Cyber 计划:拉入一批顶级安全厂商和企业,基于 GPT-5.4-Cyber 模型提供共计 $10M 的 API 赞助,用于强化全球 cyber defense 生态。这与 Anthropic 今日 Opus 4.7 "刻意下调 cyber 能力"的姿态形成对比——OpenAI 正把前沿 cyber 能力按"可信访问"条件开放,Anthropic 选择压制。
项目形式:Trusted Access 白名单 + $10M API 赞助
核心模型:GPT-5.4-Cyber(先前以闭源逆向工程能力出名)
两家分野:OpenAI 走"有条件开放",Anthropic 走"默认压制"
https://openai.com/index/accelerating-cyber-defense-ecosystem
前瞻与传闻
Anthropic 暗示 "Mythos" 为下一代内部模型,Opus 4.7 为缓冲版
随 Opus 4.7 发布,多家外媒引述 Anthropic 披露:其内部尚未发布的 "Mythos" 模型在网络攻击等高风险能力上明显强于 Opus 4.7,本次 Opus 4.7 刻意下调了 cyber 能力,以便在公开产品中先部署更保守的版本。
官方姿态:把"内部能力 > 公开版"作为一种安全叙事
隐含信号:Mythos 级别的前沿模型在内部已可用
https://www.axios.com/2026/04/16/anthropic-claude-opus-model-mythos
🎙 本周推荐播客
Why Claude Feels Different (And What That Means for AI) | The a16z Show
本集从文化、人际关系和产品构建的角度探讨 Claude 为何在用户体验上与其他 LLM 感觉不同,并分析 AI 如何重塑这些领域。对话涉及默会知识(tacit knowledge)在 AI 时代的角色,以及技术如何改变我们构建产品的方式。
频道:a16z|⏱ 33:20
核心主题:Claude 的差异化体验 —— AI 如何重塑文化与产品设计
嘉宾视角:a16z GP Erik Torenberg 与 Anish Acharya,从投资人和产品观察者视角
关键观点:Claude 的"感觉不同"背后是 Anthropic 对 tacit knowledge 和价值对齐的独特重视,而非单纯性能差距
适合听众:每天使用 Claude 的开发者和 AI 产品思考者
https://www.youtube.com/watch?v=Mjc7vwys1vY
The GPT Moment for Robotics Is Here
Physical Intelligence 正在构建可控制任意机器人、执行任意任务的基础模型,团队将其定位为机器人领域的 GPT-1 时刻。公司采用跨实体(cross-embodiment)训练方法,试图打造机器人领域的通用基础模型,而非针对单一机型优化。
频道:Y Combinator|⏱ 49:27
核心主题:机器人基础模型的 GPT 时刻 —— cross-embodiment 方法与通用控制
嘉宾视角:Physical Intelligence 团队,从 AI foundation model 创业角度讲
关键观点:机器人控制不再需要为每个机型单独训练,跨实体统一模型是下一个突破口
适合听众:对 robotics + AI 基础模型交叉感兴趣的工程师和研究者
https://www.youtube.com/watch?v=4EsUaur0nsQ
Episode 16: Building AI for Life Sciences
OpenAI research lead Joy Jiao 和 product lead Yunyun Wang 讨论如何为生命科学构建实际可用的 AI 系统,以及在这一高风险领域做负责任 AI 开发意味着什么。对话聚焦于科学家真正需要的 AI 能力,而非泛化的 LLM 功能。
频道:OpenAI|⏱ 44:25
核心主题:为生命科学场景定制 AI —— 科学家需要什么、现有模型差在哪里
嘉宾视角:OpenAI 内部研究和产品负责人,从开发者视角讲实际应用挑战
关键观点:生命科学 AI 的核心难点在可解释性与错误容忍度,与通用 LLM 目标存在结构性张力
适合听众:医疗/生命科学领域 AI 应用研究者,包括 Medical Physics
https://www.youtube.com/watch?v=UZyH0nx5zgI
Jensen Huang – Will Nvidia's moat persist?
Dwarkesh 与 Jensen Huang 深度对话,探讨 TPU 竞争对 Nvidia 护城河的威胁、Nvidia 对日益紧张的供应链的控制力、AI 芯片出口中国的政策争议,以及 Nvidia 为何不选择自建云服务。对话涵盖芯片行业结构、AI 算力瓶颈和长期战略判断。
频道:Dwarkesh Podcast|⏱ 1:43:12
核心主题:Nvidia 的护城河能否在 TPU 竞争和地缘政治压力下持续
嘉宾视角:Jensen Huang 本人,从 Nvidia CEO 的长期战略视角
关键观点:Nvidia 的优势不只是 GPU,而是整个 CUDA 生态和供应链纵深,短期内竞争者难以复制
适合听众:关注 AI 基础设施、芯片战略和 AI 算力经济学的技术从业者
https://www.youtube.com/watch?v=Hrbq66XqtCo
The AI Model Built for What LLMs Can't Do
Logical Intelligence CEO Eve Bodnia 认为当前 AI 公司竞相扩大 LLM 规模的方向是错误的。她的公司正在开发一种基于非 transformer 架构的替代模型,专门针对 LLM 的结构性短板设计。
频道:Every|⏱ 53:37
核心主题:非 LLM 路线的 AI 模型 —— transformer 架构的局限与替代方案
嘉宾视角:Eve Bodnia,创业者,从反主流技术路线的批判性角度
关键观点:LLM 在逻辑推理和确定性任务上存在架构级缺陷,规模扩展无法根本解决
适合听众:对 AI 架构替代路线感兴趣的研究者和技术决策者
https://www.youtube.com/watch?v=Q-i8ZSUCtIc
AI in the AM: RL for EE, Oversight w/out Nationalization, & the first AI-Run Retail Store
本集特别版 AI in the AM 汇集三个前沿主题:Quilter 的 Sergiy Nesterenko 讲强化学习在电路板设计(EE)中的应用;Stanford 的 Andy Hall 讨论 AI 行为治理与监管新模式;另有首家完全由 AI 运营的实体零售店案例分析。
频道:Cognitive Revolution|⏱ 2:31:27
核心主题:RL 在工程设计的实际落地 + AI 治理新框架 + AI 运营实体零售
嘉宾视角:多位嘉宾,涵盖工业 AI 应用、政策研究和商业实践三个维度
关键观点:RL 在 EE 设计中的应用证明 AI 正从辅助工具变为主动设计者;治理层面"监管但不国有化"是当前主流共识
适合听众:关注 AI 在工程/科学领域落地及 AI 治理议题的研究者
https://www.youtube.com/watch?v=Gm2ol_FG8ZQ
The Early Days of Anthropic & How 21 of 22 VCs Rejected It | Anj Midha
Anjney Midha 是 Anthropic 的创始投资人,本集讲述 Anthropic 早期被 21 家 VC 拒绝的融资历程,以及他对当前 AI 发展的四大瓶颈判断。对话涵盖 frontier AI 投资逻辑、Anthropic 的差异化路线,以及 AI 行业结构性挑战。
频道:20VC with Harry Stebbings|⏱ 1:15:19
核心主题:Anthropic 早期融资故事 + frontier AI 的四大发展瓶颈
嘉宾视角:Anjney Midha,Anthropic 创始投资人兼前 a16z GP,从内部人视角
关键观点:Anthropic 被大量 VC 拒绝的核心原因是安全优先策略被认为商业化太慢;四大瓶颈包括算力、数据、人才和监管
适合听众:关注 AI 创业史、投资决策逻辑和 Anthropic 具体战略的从业者
https://www.youtube.com/watch?v=a1ymdW-h33E
夜雨聆风