让机器理解物理世界,是具身智能最难的那块拼图。
英伟达今日推出Cosmos 3,这是一款面向物理AI的开放世界基础模型,基于混合Transformer架构构建,将视觉推理、世界生成和动作预测集成至单一系统。

示意图(配图与文章内容无关)
01 全球首款全模态开源模型
Cosmos 3是全球首款完全开放的全模态模型,能够以领先的物理精度原生理解并生成文本、图像、视频、环境音和动作。
这将物理AI的训练和评估周期从数月缩短至数天。

示意图(配图与文章内容无关)
02 Cosmos Coalition:巨头联手
英伟达同时宣布成立NVIDIA Cosmos Coalition,成员包括Agile Robots、Black Forest Labs、Generalist、LTX、Runway和Skild AI。
黄仁勋表示:"物理AI是实现通用机器人最关键的一步。"
这个联盟的目标是推动下一代世界模型发展。
示意图(配图与文章内容无关)
03 开源意味着什么
开放意味着全球开发者都可以基于Cosmos 3构建自己的物理AI应用。对于机器人厂商而言,这意味着
不再需要从零训练世界模型,直接站在英伟达的肩上。
🔥 今日互动
开源物理AI模型,会加速机器人进入普通人家庭吗?
---
本文由AI辅助创作,内容来源:英伟达官方博客、新华社。
夜雨聆风