2024年的某个公开演讲里,李飞飞说了四个字:"空间智能"。
当时很多人没太在意。毕竟"视觉智能""感知智能"这些概念已经说了很多年,"空间智能"听起来不过是又一个漂亮的名词创新。但如果你仔细看李飞飞过去五年的研究轨迹,会发现这四个字背后,藏着一个极具野心的判断:AI的下一场革命,将在"看到"和"理解"之间的那片空白里爆发。
一、什么是空间智能?
简单说,空间智能是AI理解和操作三维世界的能力。
传统的AI视觉,我们让它"看"一张图片,它可以识别出"这里有一只猫"。但空间智能要解决的问题是:"这只猫和它周围的空间关系是什么?它距离左边的椅子有多远?如果我想伸手去摸它,需要绕过哪些障碍物?"
这不是简单的图像识别,这是对物理世界的数学建模和空间推理。
李飞飞提出这个概念时,指出了空间智能的四个核心维度:
语义理解——知道物体是什么物理理解——知道物体的物理属性(重量、材质、硬度)几何理解——知道物体在空间中的位置、朝向、形状动态交互——知道物体如何随时间变化、如何被操作
当这四个维度融合在一起,AI才能真正"看懂"世界,而不是只能"辨认"世界。

二、为什么这个方向现在爆发?
空间智能不是一个新概念。李飞飞本人在计算机视觉领域深耕了二十年,ImageNet等项目已经为视觉识别奠定了坚实基础。为什么"空间智能"这个概念在2024年被正式提出,并在2025-2026年成为行业焦点?
答案:大模型和多模态AI的突破,让"理解空间"这件事第一次有了技术可行性。
过去的AI视觉,核心是"分类"——给图片打标签。但空间智能需要的是"推理"——在三维空间里理解物体之间的关系。这种推理需要强大的背景知识(物理常识、生活经验)和复杂的计算能力(几何计算、路径规划)。
大语言模型(LLM)的突破,恰恰提供了前者。多模态模型的进步,则让AI不仅能处理文字,还能同时理解图像、深度信息、点云数据。两者结合,空间智能的技术基础才真正成熟。
三、空间智能如何改变AI的能力边界?
理解空间,对AI来说意味着什么?
最直接的应用,是机器人。
一个能"看懂"三维空间的机器人,才能在真实的物理世界里完成精细操作。抓取一个易碎的玻璃杯、绕过障碍物行走、在不确定的环境中自主导航——这些看似简单的动作,对AI的视觉理解要求极高。
波士顿动力的Atlas机器人,在2025年展示了新的能力:它不仅能跑能跳,还能根据实时空间感知调整动作策略。这是空间智能在机器人领域的典型应用。
但机器人的商业化,只是空间智能的冰山一角。
自动驾驶需要空间智能——理解周围车辆的位置、速度、意图,预测它们的轨迹,做出驾驶决策。AR/VR需要空间智能——实时构建三维场景,理解用户的视角变化,提供沉浸式体验。医疗影像需要空间智能——理解器官的三维结构,辅助手术规划和诊断。工业设计需要空间智能——理解零件的装配关系,优化生产流程,检测缺陷。
可以说,任何需要AI"理解物理世界"的场景,空间智能都是底层能力。

四、Agent大爆发:2026年的40%企业应用
提到Agent,大多数人想到的是"数字员工"——处理邮件、回复客服、写代码。但如果你把空间智能和Agent结合起来,会发现一个更有想象力的方向:能感知物理世界的Agent。
这类Agent不只存在于电脑里,它们能操控真实的机器人和设备。想象一个Agent,它能理解工厂车间的三维布局,自动调度AGV(自动导引车)规划最优路径,实时调整生产节奏——这就是空间智能给Agent带来的能力跃升。
根据行业预测,到2026年底,40%的企业级AI应用将深度嵌入Agent能力。这些Agent不再只是处理数据和文字,而是能"看见"工作现场,"理解"物理操作,"执行"实体任务。
李飞飞在接受采访时说过一句让我印象深刻的话:"AI在虚拟世界里已经足够聪明,但在物理世界里,它还是个孩子。空间智能的目标,是让AI在物理世界里也成熟起来。"
五、空间智能的竞争:中国力量不可忽视
在这场空间智能的全球竞赛中,中国力量正在快速崛起。
一方面,国内的AI研究机构在三维视觉、点云理解、机器人控制等领域持续投入,多个研究成果达到国际领先水平。另一方面,国内丰富的应用场景——制造业智能化、智慧物流、自动驾驶、无人机——为空间智能的落地提供了天然的土壤。
更重要的是,国内的科技企业正在把空间智能从实验室推向商业应用。大疆的无人机可以自主避障、字节跳动的AR产品开始进入消费市场、华为的机器人团队在工业场景里持续探索……这些实践,正在积累宝贵的空间智能数据和经验。
六、写在最后:让AI"看见"更大的世界
如果AI的发展是一条河流,语言大模型解决的是"思考"的河流,空间智能要解决的则是"看见"的河流。
当AI既能思考又能看见,它才能真正成为人类在各领域的超级助手——不只是回答问题,而是在真实世界里帮你完成任务。
李飞飞提出"空间智能"这个概念时,很多人在讨论这会不会是又一个"热门但难落地"的技术概念。但如果你看最近两年的技术进展——具身智能的突破、RobotGPT的出现、自动驾驶的加速——你会发现空间智能已经不是概念,而是正在发生的现实。
2026年,AI正在学会"看"这个世界。这件事的意义,可能比我们想象的更大。

夜雨聆风