AI 早报 2026-04-17|Anthropic Claude Opus 4.,阿里通义开源 Qwen3.6-35B-A3B,Open GPT-Rosalind

AI 早报 2026-04-17

概览

要闻

Anthropic 发布 Claude Opus 4.7：代码与长任务能力全面升级

模型发布

阿里通义开源 Qwen3.6-35B-A3B：3B 激活的 Agent 编程稀疏 MoE
腾讯混元开源 HY-World 2.0：单图/文字生成可编辑 3D 世界
Google Gemini 3.1 Flash TTS：支持 audio tags 的可控语音
OpenAI 发布 GPT-Rosalind：面向生命科学研究的前沿推理模型

开发生态

OpenAI Codex 大升级：Computer Use、内置浏览器、图像生成、长期任务
Anthropic 为 Claude Code 开发者发布专属推文账号 @ClaudeDevs
Cursor 原生支持 Opus 4.7，限时 50% 折扣
Vercel Workflows 正式 GA：代码即编排器的长任务基础设施
CC v2.1.112 / Codex 0.122.0-alpha / LangChain Core 1.3.0a3

产品应用

Perplexity Personal Computer for Mac 全面开放，默认 Opus 4.7
Replit Agent 4 内置 Opus 4.7，同步限时 5 折
Apple 把不到 200 名 Siri 工程师送去学 Claude Code / Codex
Adobe Firefly AI Assistant：把创意套件变成聊天机器人

行业动态

💰 CoreWeave 本周连签 Meta、Anthropic、Jane Street 三笔大单
💰 OpenAI 推出 Trusted Access for Cyber + $10M API 赞助，搭配 GPT-5.4-Cyber

前瞻与传闻

Anthropic 暗示 "Mythos" 为下一代内部模型，Opus 4.7 为缓冲版

🎙 本周推荐播客

Why Claude Feels Different (And What That Means for AI) | The a16z Show
The GPT Moment for Robotics Is Here
Episode 16: Building AI for Life Sciences
Jensen Huang – Will Nvidia's moat persist?
The AI Model Built for What LLMs Can't Do
AI in the AM: RL for EE, Oversight w/out Nationalization, & the first AI-Run Retail Store
The Early Days of Anthropic & How 21 of 22 VCs Rejected It | Anj Midha

要闻

Anthropic 发布 Claude Opus 4.7：代码与长任务能力全面升级

Anthropic 今日正式发布 Claude Opus 4.7，定位为迄今最强的 Opus 模型，核心升级集中在复杂软件工程、长时间自主任务执行与图像/视觉推理；价格与 4.6 持平（输入 $5/M、输出 $25/M），已同步上架 Claude 产品、API、Bedrock、Vertex、Foundry，并被 Cursor、Replit Agent 4、Perplexity Personal Computer 第一时间接入为默认模型。

能力变化：编码基准提升约 13%，生产任务解决率声称为 4.6 的 3 倍，自我验证后再汇报结果

视觉升级：支持最长边 2576 像素高分辨率图片、新分词器保留高频细节

工具面：Claude Code 新增 /ultra-review命令，推理等级新增 xhigh（介于 high 与 max 之间），Max 订阅开放 auto-approve

安全立场：刻意下调网络攻击相关能力，并加入高风险 cyber 请求的自动检测防护

https://www.anthropic.com/news/claude-opus-4-7

模型发布

阿里通义开源 Qwen3.6-35B-A3B：3B 激活的 Agent 编程稀疏 MoE

阿里通义实验室开源 Qwen3.6-35B-A3B，采用 Apache 2.0 协议：总参数 35B、激活 3B 的稀疏 MoE，声称在 Agent 编程上可对标激活规模 10 倍于它的模型，具备多模态感知/推理与思考/非思考双模式。HuggingFace、ModelScope 已上权重，API（Qwen3.6-Flash）即将上线百炼。

定位：低成本 Agent 编程与多模态推理，官方 RefCOCO 92.0

生态：可直接接入 OpenClaw、Claude Code、Qwen Code 等第三方 Agent CLI

开源协议：Apache 2.0，允许商用

https://x.com/Alibaba_Qwen/status/2044768734234243427

腾讯混元开源 HY-World 2.0：单图/文字生成可编辑 3D 世界

腾讯混元发布并开源 HY-World 2.0：多模态世界模型，支持从文本、图像、视频生成和重建 3D 世界，导出 Mesh/3DGS/点云等格式，直接对接 Blender、Unity、Unreal、Isaac Sim。与 Genie 3/Cosmos 的像素级视频路径不同，HY-World 2.0 输出的是可编辑、持久化的 3D 资产。

两大能力：世界生成（文本/单图→3D）和世界重建（多视图/视频→3D）

交互：第一/第三人称自由探索，带基于物理的碰撞

面向场景：游戏关卡原型、具身智能仿真训练

https://github.com/Tencent-Hunyuan/HY-World-2.0

Google Gemini 3.1 Flash TTS：支持 audio tags 的可控语音

Google 发布 Gemini 3.1 Flash TTS，主打 audio tags——在文本中内嵌 [excitement]、[explanatory]这类自然语言标签，即可在同一句话里切换情感、语速、语调；支持 70+ 语言（24 种评估为高质量）。

控制方式：标签与正文混排，无需额外参数，可替代 SSML

语言覆盖：含日语、印地语、阿拉伯语等 70+ 语言

https://x.com/GoogleAI/status/2044447560384102592

OpenAI 发布 GPT-Rosalind：面向生命科学研究的前沿推理模型

OpenAI 今日发布 GPT-Rosalind，定位为"面向生命科学的前沿推理模型"，专为药物发现、基因组学分析、蛋白质推理与科学研究工作流加速而设计。这是 OpenAI 继 GPT-5 主模型线之后，首个显式面向科学领域的前沿模型分支。

任务领域：药物发现、基因组分析、蛋白质结构/功能推理、实验设计

命名来源：致敬 Rosalind Franklin（DNA 结构关键贡献者），定位"科学 AI 助手"

战略意义：OpenAI 开始把前沿模型按领域分叉（Cyber、Rosalind、主线），而非单一通用模型

https://openai.com/index/introducing-gpt-rosalind

开发生态

OpenAI Codex 大升级：Computer Use、内置浏览器、图像生成、长期任务

OpenAI 将 Codex 从"编程 agent"扩展为"通用 Mac 工作助手"：新版可直接用鼠标/键盘操作 Mac 应用（computer use），带独立指针、可与用户并行多 agent；内置应用内浏览器（来自 Atlas 技术栈），支持 DOM 级评论反馈；集成图像生成/编辑/GIF；新增 90+ 插件（GitHub、JIRA、Slack 等）、长期记忆与计划任务自动化。

Computer Use：自己操作 Mac 应用，不打扰用户本地操作

In-app browser：直接点选网页元素作为上下文喂给 agent

Ongoing tasks：跨日/跨周的计划任务自动执行

插件生态：一次新增 90+ 第三方插件

https://openai.com/index/introducing-upgrades-to-codex/

Anthropic 为 Claude Code 开发者发布专属推文账号 @ClaudeDevs

Anthropic 建立独立的 @ClaudeDevs 账号，作为 Claude 开发者直接获取 changelog、API 发布、社区更新的单一来源，以配合 Opus 4.7 与 Claude Code 持续加速的发布节奏。

定位：面向 builder 的变更日志 + API 更新 + 社区动态

节奏信号：Anthropic 当前在 push desktop app + Opus 4.7 + Routines + Auto mode，更新频率高到需要独立频道

https://x.com/alexalbert__/status/2044790979820183721

Cursor 原生支持 Opus 4.7，限时 50% 折扣

Cursor 在 Opus 4.7 上线后 <1 小时内完成集成，并推出限时 50% 折扣；官方描述为 "impressively autonomous、reasoning 更有创造性"。

速度：与 Anthropic 发布同步

折扣：限时 50%，具体时长未披露

https://x.com/cursor_ai/status/2044785960899236341

Vercel Workflows 正式 GA：代码即编排器的长任务基础设施

Vercel Workflows 宣布 GA：让开发者用自己的代码作为 orchestrator，无需管理队列、重试、worker，就能部署 agents、backends 或任意长时任务。

定位：与 Temporal、Inngest、AWS Step Functions 同一生态位

卖点：retries/queues/workers 下沉，代码即状态机

https://x.com/vercel/status/2044850971185213495

CC v2.1.112 / Codex 0.122.0-alpha / LangChain Core 1.3.0a3

Claude Code 今日连发 v2.1.110 → v2.1.112 三版，Codex 推出 Rust 0.121.0 正式版和 0.122.0-alpha 预览版（匹配桌面大更新），LangChain Core 进入 1.3.0 alpha 系列。

Claude Code：今日 2 次 patch，昨日 1 次 patch

Codex Rust：0.121 正式版今日配合产品大更新上架

LangChain：核心库准备 1.3 大版本，目前还在 alpha

https://github.com/anthropics/claude-code/releases

产品应用

Perplexity Personal Computer for Mac 全面开放，默认 Opus 4.7

Perplexity 把去年 3 月预告的 Personal Computer 正式推给所有 Max 订阅者和 waitlist 用户：在 Mac 上作为多模型编排层，跨本地文件、原生应用、connectors 和 web 跑长时/连续任务，并宣布 Claude Opus 4.7 成为该产品的默认编排模型。

作用域：本地文件 + 原生 app + connectors + web 统一编排

默认模型：Claude Opus 4.7

定价：Perplexity Max（$200/月）订阅包含

https://www.perplexity.ai/hub/blog/personal-computer-is-here

Replit Agent 4 内置 Opus 4.7，同步限时 5 折

Replit Agent 4 在 Opus 4.7 上线当日完成底层模型升级，并推出限时 50% 折扣，组合无限画布 + 并行 agent + Opus 4.7 三件套。

https://x.com/Replit/status/2044838078792286290

Apple 把不到 200 名 Siri 工程师送去学 Claude Code / Codex

Apple 启动"AI coding bootcamp"，将少于 200 名 Siri 工程师分批送入多周课程，学习如何使用 Anthropic Claude Code 和 OpenAI Codex 等 AI 编码工具——这是罕见的"大厂主动承认 agent-first 工作流已成为必修课"的信号。

规模：<200 名工程师，Siri 团队为主

课程内容：Claude Code + Codex 使用范式

战略含义：苹果官方承认 AI 辅助编码已超越生产力工具边界

https://the-decoder.com/apple-sends-siri-developers-to-ai-coding-bootcamp/

Adobe Firefly AI Assistant：把创意套件变成聊天机器人

Adobe 发布 Firefly AI Assistant，跨 Photoshop、Premiere 等多个应用提供统一的 AI agent 对话界面，可代替用户在不同 app 间穿梭执行创意工作流。

https://the-decoder.com/adobe-turns-its-creative-suite-into-a-chatbot-with-the-new-firefly-ai-assistant/

行业动态

💰 CoreWeave 本周连签 Meta、Anthropic、Jane Street 三笔大单

一周之内 CoreWeave 公布三份重磅协议：Meta 将承诺扩到累计约 $35B（用于 Muse Spark 推理扩容），与 Anthropic 签订多年 Claude 基础设施合作，Jane Street 签 $6B 云服务并以 $109/股注资 $1B 股权；三家都获得 NVIDIA Vera Rubin 平台早期使用权。

金额：Meta ~$35B cumulative、Jane Street $6B + $1B equity、Anthropic 未披露

硬件：NVIDIA Vera Rubin 下一代平台早期部署

信号：推理算力合同成为新一轮 AI infra 竞赛核心

https://www.coreweave.com/news/jane-street-signs-6-billion-ai-cloud-agreement-with-coreweave

💰 OpenAI 推出 Trusted Access for Cyber + $10M API 赞助，搭配 GPT-5.4-Cyber

OpenAI 发布 Trusted Access for Cyber 计划：拉入一批顶级安全厂商和企业，基于 GPT-5.4-Cyber 模型提供共计 $10M 的 API 赞助，用于强化全球 cyber defense 生态。这与 Anthropic 今日 Opus 4.7 "刻意下调 cyber 能力"的姿态形成对比——OpenAI 正把前沿 cyber 能力按"可信访问"条件开放，Anthropic 选择压制。

项目形式：Trusted Access 白名单 + $10M API 赞助

核心模型：GPT-5.4-Cyber（先前以闭源逆向工程能力出名）

两家分野：OpenAI 走"有条件开放"，Anthropic 走"默认压制"

https://openai.com/index/accelerating-cyber-defense-ecosystem

前瞻与传闻

Anthropic 暗示 "Mythos" 为下一代内部模型，Opus 4.7 为缓冲版

随 Opus 4.7 发布，多家外媒引述 Anthropic 披露：其内部尚未发布的 "Mythos" 模型在网络攻击等高风险能力上明显强于 Opus 4.7，本次 Opus 4.7 刻意下调了 cyber 能力，以便在公开产品中先部署更保守的版本。

官方姿态：把"内部能力 > 公开版"作为一种安全叙事

隐含信号：Mythos 级别的前沿模型在内部已可用

https://www.axios.com/2026/04/16/anthropic-claude-opus-model-mythos

🎙 本周推荐播客

Why Claude Feels Different (And What That Means for AI) | The a16z Show

本集从文化、人际关系和产品构建的角度探讨 Claude 为何在用户体验上与其他 LLM 感觉不同，并分析 AI 如何重塑这些领域。对话涉及默会知识（tacit knowledge）在 AI 时代的角色，以及技术如何改变我们构建产品的方式。

频道：a16z｜⏱ 33:20

核心主题：Claude 的差异化体验 —— AI 如何重塑文化与产品设计

嘉宾视角：a16z GP Erik Torenberg 与 Anish Acharya，从投资人和产品观察者视角

关键观点：Claude 的"感觉不同"背后是 Anthropic 对 tacit knowledge 和价值对齐的独特重视，而非单纯性能差距

适合听众：每天使用 Claude 的开发者和 AI 产品思考者

https://www.youtube.com/watch?v=Mjc7vwys1vY

The GPT Moment for Robotics Is Here

Physical Intelligence 正在构建可控制任意机器人、执行任意任务的基础模型，团队将其定位为机器人领域的 GPT-1 时刻。公司采用跨实体（cross-embodiment）训练方法，试图打造机器人领域的通用基础模型，而非针对单一机型优化。

频道：Y Combinator｜⏱ 49:27

核心主题：机器人基础模型的 GPT 时刻 —— cross-embodiment 方法与通用控制

嘉宾视角：Physical Intelligence 团队，从 AI foundation model 创业角度讲

关键观点：机器人控制不再需要为每个机型单独训练，跨实体统一模型是下一个突破口

适合听众：对 robotics + AI 基础模型交叉感兴趣的工程师和研究者

https://www.youtube.com/watch?v=4EsUaur0nsQ

Episode 16: Building AI for Life Sciences

OpenAI research lead Joy Jiao 和 product lead Yunyun Wang 讨论如何为生命科学构建实际可用的 AI 系统，以及在这一高风险领域做负责任 AI 开发意味着什么。对话聚焦于科学家真正需要的 AI 能力，而非泛化的 LLM 功能。

频道：OpenAI｜⏱ 44:25

核心主题：为生命科学场景定制 AI —— 科学家需要什么、现有模型差在哪里

嘉宾视角：OpenAI 内部研究和产品负责人，从开发者视角讲实际应用挑战

关键观点：生命科学 AI 的核心难点在可解释性与错误容忍度，与通用 LLM 目标存在结构性张力

适合听众：医疗/生命科学领域 AI 应用研究者，包括 Medical Physics

https://www.youtube.com/watch?v=UZyH0nx5zgI

Jensen Huang – Will Nvidia's moat persist?

Dwarkesh 与 Jensen Huang 深度对话，探讨 TPU 竞争对 Nvidia 护城河的威胁、Nvidia 对日益紧张的供应链的控制力、AI 芯片出口中国的政策争议，以及 Nvidia 为何不选择自建云服务。对话涵盖芯片行业结构、AI 算力瓶颈和长期战略判断。

频道：Dwarkesh Podcast｜⏱ 1:43:12

核心主题：Nvidia 的护城河能否在 TPU 竞争和地缘政治压力下持续

嘉宾视角：Jensen Huang 本人，从 Nvidia CEO 的长期战略视角

关键观点：Nvidia 的优势不只是 GPU，而是整个 CUDA 生态和供应链纵深，短期内竞争者难以复制

适合听众：关注 AI 基础设施、芯片战略和 AI 算力经济学的技术从业者

https://www.youtube.com/watch?v=Hrbq66XqtCo

The AI Model Built for What LLMs Can't Do

Logical Intelligence CEO Eve Bodnia 认为当前 AI 公司竞相扩大 LLM 规模的方向是错误的。她的公司正在开发一种基于非 transformer 架构的替代模型，专门针对 LLM 的结构性短板设计。

频道：Every｜⏱ 53:37

核心主题：非 LLM 路线的 AI 模型 —— transformer 架构的局限与替代方案

嘉宾视角：Eve Bodnia，创业者，从反主流技术路线的批判性角度

关键观点：LLM 在逻辑推理和确定性任务上存在架构级缺陷，规模扩展无法根本解决

适合听众：对 AI 架构替代路线感兴趣的研究者和技术决策者

https://www.youtube.com/watch?v=Q-i8ZSUCtIc

AI in the AM: RL for EE, Oversight w/out Nationalization, & the first AI-Run Retail Store

本集特别版 AI in the AM 汇集三个前沿主题：Quilter 的 Sergiy Nesterenko 讲强化学习在电路板设计（EE）中的应用；Stanford 的 Andy Hall 讨论 AI 行为治理与监管新模式；另有首家完全由 AI 运营的实体零售店案例分析。

频道：Cognitive Revolution｜⏱ 2:31:27

核心主题：RL 在工程设计的实际落地 + AI 治理新框架 + AI 运营实体零售

嘉宾视角：多位嘉宾，涵盖工业 AI 应用、政策研究和商业实践三个维度

关键观点：RL 在 EE 设计中的应用证明 AI 正从辅助工具变为主动设计者；治理层面"监管但不国有化"是当前主流共识

适合听众：关注 AI 在工程/科学领域落地及 AI 治理议题的研究者

https://www.youtube.com/watch?v=Gm2ol_FG8ZQ

The Early Days of Anthropic & How 21 of 22 VCs Rejected It | Anj Midha

Anjney Midha 是 Anthropic 的创始投资人，本集讲述 Anthropic 早期被 21 家 VC 拒绝的融资历程，以及他对当前 AI 发展的四大瓶颈判断。对话涵盖 frontier AI 投资逻辑、Anthropic 的差异化路线，以及 AI 行业结构性挑战。

频道：20VC with Harry Stebbings｜⏱ 1:15:19

核心主题：Anthropic 早期融资故事 + frontier AI 的四大发展瓶颈

嘉宾视角：Anjney Midha，Anthropic 创始投资人兼前 a16z GP，从内部人视角

关键观点：Anthropic 被大量 VC 拒绝的核心原因是安全优先策略被认为商业化太慢；四大瓶颈包括算力、数据、人才和监管

适合听众：关注 AI 创业史、投资决策逻辑和 Anthropic 具体战略的从业者

https://www.youtube.com/watch?v=a1ymdW-h33E