AI行业周报

Anthropic 发布 Claude Opus 4.7

Anthropic 正式发布 Claude Opus 4.7，延续约两个月一次的迭代节奏，这是继 Opus 4.6 之后的直接升级。定价维持不变，每百万输入 token 5 美元、输出 25 美元。但引入了新分词器，同样文本会生成 1.0 到 1.35 倍的 token 量，实际使用成本需留意。

能力提升集中在几个方向：编程表现是核心亮点，在 Anthropic 内部 93 项编程基准上，Opus 4.7 相比 Opus 4.6 提升 13%，解决了 4 个前代模型无法攻克的任务。在 SWE-bench Pro 上达到 64.3%。Cursor 内部评测中通过率从 58% 提升至 70%。视觉能力也大幅扩展，支持长边 2576 像素、约 375 万像素的图像输入，是此前的逾 3 倍，坐标与实际像素实现 1:1 映射，对计算机操控类 Agent 和复杂图表处理场景实用价值显著。此外模型新增文件系统记忆能力，可跨 session 记录关键信息并延续到新任务，减少重复输入上下文的摩擦。

值得关注的是，Opus 4.7 同时扮演着另一个角色，成为 Mythos 系列安全护栏的首个真实测试场。Anthropic 在训练中主动压低了 Opus 4.7 的网络安全能力，并内置了自动拦截高风险网络安全请求的防护层，专业人员可通过「网络安全核查计划」申请合规使用。

目前模型已在 Claude 全线产品、API、Amazon Bedrock、Google Vertex AI 及 Microsoft Foundry 全面上线。

OpenAI 重磅升级 Codex

OpenAI 正式发布 Codex 的全新版本，将这款 AI 编程助手的能力范围从传统代码编写，扩展到整个软件开发全流程。新版 Codex 支持在 macOS 系统后台独立操控电脑，可以自主查看屏幕内容、执行点击和输入操作，同时运行多个 AI 智能体并行处理任务，且不会干扰用户正常使用电脑。

Codex 此次接入了 gpt-image-1.5 图像模型，能够在同一开发流程中直接生成和修改图片，可用于产品原型设计、前端界面制作以及游戏素材创作。产品还内置了浏览器，用户可以在网页上直接标注和注释，让 AI 更精准地理解需求，目前主要用于前端开发与游戏开发场景。

在工程能力方面，新版 Codex 支持处理 GitHub 代码评审意见、多终端并行运行、通过 SSH 连接远程环境，也能直接在侧边栏打开 PDF、表格、幻灯片等多种格式文件。插件生态也同步升级，新增超过 90 款插件，进一步扩展了工具的集成能力与适用场景。

在长期自动化能力上，Codex 实现了重要突破，支持保留上下文对话历史，重复使用之前的任务逻辑，还可以自主规划并定时执行长时间任务，持续周期可达数天甚至数周。同时推出的记忆预览功能，能够记录用户习惯、历史纠错内容和关键信息，让后续任务执行更高效、更贴合个人习惯。

这一轮升级标志着 Codex 真正从代码生成工具进化为完整的 AI 开发助手，不再只是辅助写代码，而是具备了独立操作电脑、长期执行任务、自主规划工作流的能力。

李飞飞团队发布 Spark 2.0 开源引擎

2026 年 4 月 15 日，李飞飞旗下 AI 世界模型公司 World Labs 正式发布并开源Spark 2.0—— 一款基于 Three.js 与 WebGL2 打造的动态 3D 高斯点云（3DGS）渲染引擎，首次实现亿级粒子 3D 场景在手机、VR 等普通设备浏览器上的流畅流式渲染，大幅降低 3D 交互世界的使用门槛。

3D 高斯溅射（3DGS）技术可通过照片快速生成逼真 3D 场景，但数据量极大、普通设备难以承载，且现有渲染器存在单对象限制、依赖高规格接口、不支持动态效果等问题。Spark 系列正是为解决这些痛点而生，1.0 版本已实现多对象正确渲染，而 2.0 版本则攻克了超大规模场景的核心难题。

Spark 2.0 依靠三大关键技术实现突破：一是连续 LoD 树，根据视角与距离动态分配渲染精度，配合注视点渲染，让设备始终只渲染 “够用” 的粒子量，保持帧率稳定；二是全新 RAD 格式，支持分块压缩与渐进式流式加载，先显示轮廓再逐步加载细节，如同刷短视频般流畅；三是GPU 虚拟内存管理，借鉴系统虚拟内存机制，用固定内存池实现超大场景调度，理论上可拼接无限大的 3D 世界。

该引擎已在多个项目中落地验证，包括搭载亿级粒子的浏览器太空游戏、虚实结合的互动艺术作品、千万级粒子真实场景渲染等，在手机、Quest、Vision Pro 等设备上均表现稳定。李飞飞也公开表示，Spark 2.0 能在任意设备上流畅运行超 1 亿个 splat 对象，团队希望以开源方式助力 Web 端 3DGS 渲染生态发展。

作为 World Labs AI 世界模型战略的重要一环，Spark 2.0 还与团队的 Marble 创作平台深度打通。可通过文字或图片一键生成 3D 世界，最终以网页链接的形式交付给用户。

阿里发布 Meoo（秒悟）

阿里 ATH 事业群正式发布旗下首款 AI 开发工具 Meoo（秒悟），面向零编程基础用户，主打自然语言驱动开发与一键云端部署。产品定位一句话概括，用户只需描述想法，剩下的交给 AI 全程接手。

模型层集成 Qwen3.6-Plus、Kimi K2.5、GLM-5、MiniMax-M2.5 四款国内主流大模型，可按任务自动选优。智能体框架支持「蜂群模式」，多个 Agent 并行处理子任务，简单应用最快 1 分钟生成；复杂需求可切换 Agent 模式，由 AI 自主规划、拆解并自我修复。云服务层内置阿里云数据库、存储、域名、FC 沙盒、NAS 文件系统及百炼模型 API，无需用户手动配置，生成的应用前后端俱全，直接一键部署上线。

值得注意的是，阿里内部已有超过 1 万名非技术岗员工在用 Meoo 开发效率工具、生活应用与娱乐类产品，来自财务、设计、产品、运营等部门，这批内部用户本身就是对产品可行性的一次提前验证。

ATH 事业群成立于今年 3 月，由 CEO 吴泳铭亲自挂帅，定位「Token Hub」，目标是从模型创造到应用落地打通全链路。Meoo 是这个事业群的第一个对外产品。这条赛道并不冷清，字节的 Trae、腾讯的 CodeBuddy、百度的秒哒都已提前入场，但多数工具仍面向有一定技术背景的用户。

Meoo 的差异化在于打通了从「生成」到「部署」的完整闭环，真正让非技术用户也能跑完全程。AI 编程工具的竞争重心，正在从「谁的代码写得更好」转向「谁能服务更多人」，这或许是 2026 年这条赛道更值得关注的方向。

火山引擎发布 Seedance 2.0 API

本周，火山引擎正式上线 Seedance 2.0 系列 API 服务，用户可通过火山方舟平台调用其视频生成能力。

平台同时建立了严格的肖像与版权安全标准，并预置超过 1 万个高质量虚拟人像，方便用户直接使用，有效提升商用合规性与创作效率。

此次升级标志着火山引擎将 AI 视频能力从演示级推向商用级，通过开放 API 让更多企业、开发者能够快速集成视频生成能力。多模态输入 + 高可用率 + 合规体系，也让 Seedance 2.0 更贴合短剧、广告、营销内容等工业化生产需求，预示着 AI 视频正在从娱乐玩票走向真正的产业赋能。

腾讯开源混元 3D 世界模型 2.0

腾讯正式发布并开源混元 3D 世界模型 2.0（HY-World 2.0），支持文本、图片、视频多模态输入，能够直接输出适配 Unity、UE 等主流引擎的 3DGS 与 Mesh 格式资产，完美融入现有游戏开发工作流。

与谷歌 Genie 3 等只能生成视频画面的世界模型不同，HY-World 2.0 生成的内容具备实际工程价值，支持二次编辑、修改和复用，真正做到可交互、可导入、可落地使用。用户只需输入文字或图片，就能快速生成写实、卡通、游戏等多种风格的可漫游 3D 空间，并且内置物理碰撞与角色交互能力。

模型同时支持数字孪生重建，通过真实场景视频或多视角图片，即可快速重建高精度三维空间，生成一次便可长期重复使用。在技术架构上，HY-World 2.0 围绕核心 3D 生成能力，整合了全景图生成、轨迹规划、世界扩展与世界合成四大模块，实现从多模态输入到完整 3D 世界的一站式构建。

这次开源意味着 3D 世界模型正式从演示性技术走向工业化可用阶段。过去 AI 生成的 3D 内容大多只能看、不能用，难以进入实际生产环节，而混元 2.0 直接解决了格式兼容、可编辑性、工程化落地三大痛点。对于游戏、VR、数字孪生行业来说，这会大幅降低内容制作成本，缩短开发周期。