独家观点|物理AI的“Aha moment”卡在哪?伯克利艾伦·杨:缺一个DeepMind式的强化学习突破-夜雨聆风

独家观点|物理AI的“Aha moment”卡在哪?伯克利艾伦·杨:缺一个DeepMind式的强化学习突破

独

家

观

点

世界人工智能大会（WAIC）于2024年12月正式推出首份刊物《WAIC UP!》，这是一部「AI时代进化指南」。我们邀请全球AI及跨领域的先锋力量，借由他们的独特视角，针对AI争议问题，带来一些反直觉、非共识的思辨观点。

本期嘉宾是加州大学伯克利分校研究科学家艾伦·杨。他在硅谷待了20年，做过AR/VR首席设计师，带学生拿过自动驾驶世界冠军。

他的观点，每一句都在挑战行业共识。这篇文章是一个来自伯克利实验室+硅谷一线的技术判断：物理AI的“Aha moment”卡在哪里，中国供应链为什么是王牌，以及为什么“让AI失控”才是安全的唯一路径。

Allen Yang

艾伦·杨

加州大学伯克利分校电子工程与计算机科学系研究科学家
FHL Vive增强现实中心创始执行主任
伯克利AI竞速项目主席
Hitch Open世界AI竞速锦标赛裁判委员会主席

他主导AR/VR、元宇宙及赛车自动驾驶研究，创立相关学位课程。他发起伯克利AI赛车队，2025年率队获CES自动驾驶挑战赛头对头超车冠军。另外，作为硅谷连续创业者，他曾任两款AR/VR智能眼镜首席设计师，拥有20余项专利。

以下为Allen独家观点的部分摘录：

物理AI的“Aha moment”：比大语言模型难在哪？

“物理智能犯错，代价比大语言模型高得多。”

/ 01

ChatGPT为什么能那么快火？

“因为它站在了巨人的肩膀上，”艾伦·杨说，“之前的互联网，已经把人类的语言知识全部数字化了。它只需要做个爬虫去爬互联网，就能获得这些知识。”

但物理AI没有这个“巨人”。

“任何人炒了个菜、开了辆车、扫了个地，不会把自己的动作数字化，然后放在互联网上让你去爬。而且物理空间还涉及隐私问题。”

所以，物理AI的突破点不在模型，而在训练方法。

“我们需要一个像DeepMind那样的强化学习突破——不用监督学习，通过两套AI系统从小白开始左右互搏，就能找到比人类更优的策略。”

而他选择用赛车来做这件事。

“当我们的车开到120迈的时候，你必然要问：这车开160迈的时候安全吗？反过来，如果我知道它开到160迈不安全，那我也不会让家人在出行时速120公里的时候开这辆车。”

物理智能犯错，代价比大语言模型高得多。大模型说错话，你笑一笑就忘了。自动驾驶在你小区里撞了，你一辈子忘不了。

在极限边缘测试AI，不是为了比赛，而是为了让消费者拿到更安全的产品。

中国在物理AI时代的王牌：供应链

“历史不会重复，但总是押韵。”

/ 02

“过去二三十年，我们已经看到了好几轮这样的节奏。iPhone设计在加州，但产线在中国；无人机曾经美国领先，后来大疆出现了；电动汽车也一样。物理智能和机器人，很可能也是这个趋势。”

但光有硬件不够。

“我们的汽车自动驾驶，不只要知道在中国怎么做，还要知道在欧洲、美国怎么做。各个国家的人怎么开车，背后是更深层的文化差异。机器人也一样——中国、英国、德国、墨西哥的妈妈分别是怎么带孩子的？”

他提出一个“蓝海”：

物理智能公司需要重视国际文化差异，把人类背后的情感纽带，像互联网一样重新连接起来。之前，因为互联网，我们的语言和文字已经连接起来了。但我们的文化、我们的情感，目前很大一部分还是切割的。希望在物理智能的时代，我们能重新建立起新的纽带。

一个科学家的“非共识”：失败是最好的教材

“大自然没有监督学习。”

/ 03

赛道上，一辆自动驾驶赛车冲出弯道，轮胎卷起尘土，车身划出失控的弧线。在大多数人眼里，这是失败。但在伯克利AI竞速项目主席艾伦·杨眼中，这是他最珍贵的教材。

“大自然没有监督学习，”他说，“大象妈妈永远不会给小象写一本课本，然后用梯度下降去摧残自己的孩子。动物世界里，新生的婴儿、小象，每一步都是摔跤的。没有摔跤，就没有站起来的那一刻。”

他有一个独特的思维方式：用训练AI的方式来理解人类学习，又用人类学习的方式来理解AI。

AI的“预训练” = 孩子的童年
AI的“监督学习” = 填鸭式教育（给标准答案，模仿、重复）
AI的“体验式学习” = 孩子学走路（在摔跤中估算自己的价值函数）

基于这个框架，他得出了一个“非共识”判断：

真正的智能，从来不是在安全的环境里被教出来的，而是在失控的边缘自己长出来的。

Open Claw为什么是“病毒”？

“前提是，你得知道‘验证’本身意味着什么。否则，风险太大了。”

/ 04

所有人都在讨论“怎么装龙虾”，但没人问“这东西验证过吗”？

艾伦·杨说得直白：“我不会用。Open Claw本质上就是个病毒。‘病毒’是个中性词，有的病毒能治癌症，只要它能精准找到你的痛点、解决你的痛点，它就是癌症杀手。但它也有未知的风险。现在Open Claw还没有经过充分验证，它去主动调用你的电脑，风险是比较大的。”

再酷的功能，没有验证，就是风险。不是不能试，但得知道“验证”本身意味着什么。

他提醒：不要只看到“它能在你睡觉后还帮你干活”，要看到背后的安全风险。

AR/VR为什么还卡在“一眼假”？芯片+硬件+视觉显示器是通关门票

“无论打造多好的产品，一定要迭代式开发。”

/ 05

产品市场fit的三个词：Product（工程师想做的）、Market（消费者认不认可的Aha moment）、Fit（值多少钱）。AR/VR折腾了这么多年，还没真正fit。

作为AR/VR领域的早期研究者，艾伦·杨对这项技术的判断很冷静：“任何人把AR/VR放眼前，一眼就能看出来是假的。什么时候算到了‘Aha moment’？你戴上装置以后，分不出来虚拟场景到底是数字生成的，还是眼前是真实场景。”

解决痛点需要新的芯片、新的硬件加速，和高清晰的视觉显示器做深度的绑定，要做纳秒级、毫秒级的优化，目前还没人跨过去。

艾伦·杨的忠告是：对无论打造多好的产品，一定要迭代式开发。不要憋大招，不要想一步登天。

读博还是工作？先想清楚时间花在哪

“学术界的思维方式永远是跳跃性的。产业界要的不是跳跃式思维，而是迭代性的开发能力。”

/ 06

“现在的学生，最大的痛苦就在于找工作，”艾伦·杨直言，“十年、二十年前，只要你是顶尖工科学校毕业，基本是铁饭碗。但现在不一样了。AI出来了，它不但不需要那么多新鲜血液去滋养，甚至可能把老的树干也替换掉。”

他经常被学生问一个问题：要不要读博？

“很多学生看到AI火了，看到做AI的都是博士，就得出结论：我也要读博。但问题在于，你要花五年时间。这期间，你在学术界用8块GPU算未来5年、10年的问题，但压根没登上今天的列车。等博士读完，AI早就不是今天的AI了。”

他的建议很朴素：做自己喜爱的事。

“如果你喜爱去公司里工作，直接就去公司。虽然会很痛苦，但至少是痛并快乐着的。如果读博只是为了换一张现在心仪职位的入场券，五年后等你走出来，那个位置可能早已不属于这个时代。”

在AI的快速变革中，每一个犀利观点，都是帮助我们保持清醒的工具。

浏览完整内容及更多观点，欢迎点击阅读原文浏览世界人工智能大会（WAIC）首份刊物《WAIC UP!》——一部面向未来的AI时代进化指南。

可在微信小店购买纸刊

也可扫码在线阅读

扫码进入#06期《WAIC UP!》

解锁10篇AI时代最实用的解决方案

Hello:

世界人工智能大会（WAIC）推出首份刊物《WAIC UP!》，一部「AI时代进化指南」。

WAIC UP! WAKE UP MORE！

我们邀请全球AI及跨领域的先锋力量，共同释放思考的力量与智慧的主张，旨在唤醒更多人，探究关乎技术跃迁、自我边界和未来文明的无限可能。

准备好！释放你的思考，觉醒你的行动，与我们一同探究那些尚未显现的可能性，勾勒以人为中心的未来智慧文明全景图！

点击阅读原文成为WAIC会员！