Anthropic 发布 Claude Opus 4.7
Anthropic 正式发布 Claude Opus 4.7,延续约两个月一次的迭代节奏,这是继 Opus 4.6 之后的直接升级。定价维持不变,每百万输入 token 5 美元、输出 25 美元。但引入了新分词器,同样文本会生成 1.0 到 1.35 倍的 token 量,实际使用成本需留意。
能力提升集中在几个方向:编程表现是核心亮点,在 Anthropic 内部 93 项编程基准上,Opus 4.7 相比 Opus 4.6 提升 13%,解决了 4 个前代模型无法攻克的任务。在 SWE-bench Pro 上达到 64.3%。Cursor 内部评测中通过率从 58% 提升至 70%。视觉能力也大幅扩展,支持长边 2576 像素、约 375 万像素的图像输入,是此前的逾 3 倍,坐标与实际像素实现 1:1 映射,对计算机操控类 Agent 和复杂图表处理场景实用价值显著。此外模型新增文件系统记忆能力,可跨 session 记录关键信息并延续到新任务,减少重复输入上下文的摩擦。
值得关注的是,Opus 4.7 同时扮演着另一个角色,成为 Mythos 系列安全护栏的首个真实测试场。Anthropic 在训练中主动压低了 Opus 4.7 的网络安全能力,并内置了自动拦截高风险网络安全请求的防护层,专业人员可通过「网络安全核查计划」申请合规使用。
目前模型已在 Claude 全线产品、API、Amazon Bedrock、Google Vertex AI 及 Microsoft Foundry 全面上线。

OpenAI 重磅升级 Codex
OpenAI 正式发布 Codex 的全新版本,将这款 AI 编程助手的能力范围从传统代码编写,扩展到整个软件开发全流程。新版 Codex 支持在 macOS 系统后台独立操控电脑,可以自主查看屏幕内容、执行点击和输入操作,同时运行多个 AI 智能体并行处理任务,且不会干扰用户正常使用电脑。
Codex 此次接入了 gpt-image-1.5 图像模型,能够在同一开发流程中直接生成和修改图片,可用于产品原型设计、前端界面制作以及游戏素材创作。产品还内置了浏览器,用户可以在网页上直接标注和注释,让 AI 更精准地理解需求,目前主要用于前端开发与游戏开发场景。
在工程能力方面,新版 Codex 支持处理 GitHub 代码评审意见、多终端并行运行、通过 SSH 连接远程环境,也能直接在侧边栏打开 PDF、表格、幻灯片等多种格式文件。插件生态也同步升级,新增超过 90 款插件,进一步扩展了工具的集成能力与适用场景。
在长期自动化能力上,Codex 实现了重要突破,支持保留上下文对话历史,重复使用之前的任务逻辑,还可以自主规划并定时执行长时间任务,持续周期可达数天甚至数周。同时推出的记忆预览功能,能够记录用户习惯、历史纠错内容和关键信息,让后续任务执行更高效、更贴合个人习惯。
这一轮升级标志着 Codex 真正从代码生成工具进化为完整的 AI 开发助手,不再只是辅助写代码,而是具备了独立操作电脑、长期执行任务、自主规划工作流的能力。

李飞飞团队发布 Spark 2.0 开源引擎
2026 年 4 月 15 日,李飞飞旗下 AI 世界模型公司 World Labs 正式发布并开源Spark 2.0—— 一款基于 Three.js 与 WebGL2 打造的动态 3D 高斯点云(3DGS)渲染引擎,首次实现亿级粒子 3D 场景在手机、VR 等普通设备浏览器上的流畅流式渲染,大幅降低 3D 交互世界的使用门槛。
3D 高斯溅射(3DGS)技术可通过照片快速生成逼真 3D 场景,但数据量极大、普通设备难以承载,且现有渲染器存在单对象限制、依赖高规格接口、不支持动态效果等问题。Spark 系列正是为解决这些痛点而生,1.0 版本已实现多对象正确渲染,而 2.0 版本则攻克了超大规模场景的核心难题。
Spark 2.0 依靠三大关键技术实现突破:一是连续 LoD 树,根据视角与距离动态分配渲染精度,配合注视点渲染,让设备始终只渲染 “够用” 的粒子量,保持帧率稳定;二是全新 RAD 格式 ,支持分块压缩与渐进式流式加载,先显示轮廓再逐步加载细节,如同刷短视频般流畅;三是GPU 虚拟内存管理,借鉴系统虚拟内存机制,用固定内存池实现超大场景调度,理论上可拼接无限大的 3D 世界。
该引擎已在多个项目中落地验证,包括搭载亿级粒子的浏览器太空游戏、虚实结合的互动艺术作品、千万级粒子真实场景渲染等,在手机、Quest、Vision Pro 等设备上均表现稳定。李飞飞也公开表示,Spark 2.0 能在任意设备上流畅运行超 1 亿个 splat 对象,团队希望以开源方式助力 Web 端 3DGS 渲染生态发展。
作为 World Labs AI 世界模型战略的重要一环,Spark 2.0 还与团队的 Marble 创作平台深度打通。可通过文字或图片一键生成 3D 世界,最终以网页链接的形式交付给用户。

阿里发布 Meoo(秒悟)
阿里 ATH 事业群正式发布旗下首款 AI 开发工具 Meoo(秒悟),面向零编程基础用户,主打自然语言驱动开发与一键云端部署。产品定位一句话概括,用户只需描述想法,剩下的交给 AI 全程接手。
模型层集成 Qwen3.6-Plus、Kimi K2.5、GLM-5、MiniMax-M2.5 四款国内主流大模型,可按任务自动选优。智能体框架支持「蜂群模式」,多个 Agent 并行处理子任务,简单应用最快 1 分钟生成;复杂需求可切换 Agent 模式,由 AI 自主规划、拆解并自我修复。云服务层内置阿里云数据库、存储、域名、FC 沙盒、NAS 文件系统及百炼模型 API,无需用户手动配置,生成的应用前后端俱全,直接一键部署上线。
值得注意的是,阿里内部已有超过 1 万名非技术岗员工在用 Meoo 开发效率工具、生活应用与娱乐类产品,来自财务、设计、产品、运营等部门,这批内部用户本身就是对产品可行性的一次提前验证。
ATH 事业群成立于今年 3 月,由 CEO 吴泳铭亲自挂帅,定位「Token Hub」,目标是从模型创造到应用落地打通全链路。Meoo 是这个事业群的第一个对外产品。这条赛道并不冷清,字节的 Trae、腾讯的 CodeBuddy、百度的秒哒都已提前入场,但多数工具仍面向有一定技术背景的用户。
Meoo 的差异化在于打通了从「生成」到「部署」的完整闭环,真正让非技术用户也能跑完全程。AI 编程工具的竞争重心,正在从「谁的代码写得更好」转向「谁能服务更多人」,这或许是 2026 年这条赛道更值得关注的方向。

火山引擎发布 Seedance 2.0 API
本周,火山引擎正式上线 Seedance 2.0 系列 API 服务,用户可通过火山方舟平台调用其视频生成能力。
平台同时建立了严格的肖像与版权安全标准,并预置超过 1 万个高质量虚拟人像,方便用户直接使用,有效提升商用合规性与创作效率。
此次升级标志着火山引擎将 AI 视频能力从演示级推向商用级,通过开放 API 让更多企业、开发者能够快速集成视频生成能力。多模态输入 + 高可用率 + 合规体系,也让 Seedance 2.0 更贴合短剧、广告、营销内容等工业化生产需求,预示着 AI 视频正在从娱乐玩票走向真正的产业赋能。

腾讯开源混元 3D 世界模型 2.0
腾讯正式发布并开源混元 3D 世界模型 2.0(HY-World 2.0),支持文本、图片、视频多模态输入,能够直接输出适配 Unity、UE 等主流引擎的 3DGS 与 Mesh 格式资产,完美融入现有游戏开发工作流。
与谷歌 Genie 3 等只能生成视频画面的世界模型不同,HY-World 2.0 生成的内容具备实际工程价值,支持二次编辑、修改和复用,真正做到可交互、可导入、可落地使用。用户只需输入文字或图片,就能快速生成写实、卡通、游戏等多种风格的可漫游 3D 空间,并且内置物理碰撞与角色交互能力。
模型同时支持数字孪生重建,通过真实场景视频或多视角图片,即可快速重建高精度三维空间,生成一次便可长期重复使用。在技术架构上,HY-World 2.0 围绕核心 3D 生成能力,整合了全景图生成、轨迹规划、世界扩展与世界合成四大模块,实现从多模态输入到完整 3D 世界的一站式构建。
这次开源意味着 3D 世界模型正式从演示性技术走向工业化可用阶段。过去 AI 生成的 3D 内容大多只能看、不能用,难以进入实际生产环节,而混元 2.0 直接解决了格式兼容、可编辑性、工程化落地三大痛点。对于游戏、VR、数字孪生行业来说,这会大幅降低内容制作成本,缩短开发周期。

夜雨聆风