乐于分享
好东西不私藏

独家观点|物理AI的“Aha moment”卡在哪?伯克利艾伦·杨:缺一个DeepMind式的强化学习突破

独家观点|物理AI的“Aha moment”卡在哪?伯克利艾伦·杨:缺一个DeepMind式的强化学习突破

世界人工智能大会(WAIC)于2024年12月正式推出首份刊物《WAIC UP!》,这是一部「AI时代进化指南」。我们邀请全球AI及跨领域的先锋力量,借由他们的独特视角,针对AI争议问题,带来一些反直觉、非共识的思辨观点。

本期嘉宾是加州大学伯克利分校研究科学家艾伦·杨。他在硅谷待了20年,做过AR/VR首席设计师,带学生拿过自动驾驶世界冠军。

他的观点,每一句都在挑战行业共识。这篇文章是一个来自伯克利实验室+硅谷一线的技术判断:物理AI的“Aha moment”卡在哪里,中国供应链为什么是王牌,以及为什么“让AI失控”才是安全的唯一路径。

Allen Yang

艾伦·杨

  • 加州大学伯克利分校电子工程与计算机科学系研究科学家

  • FHL Vive增强现实中心创始执行主任

  • 伯克利AI竞速项目主席

  • Hitch Open世界AI竞速锦标赛裁判委员会主席

他主导AR/VR、元宇宙及赛车自动驾驶研究,创立相关学位课程。他发起伯克利AI赛车队,2025年率队获CES自动驾驶挑战赛头对头超车冠军。另外,作为硅谷连续创业者,他曾任两款AR/VR智能眼镜首席设计师,拥有20余项专利。

以下为Allen独家观点的部分摘录:

物理AI的“Aha moment”:比大语言模型难在哪?

物理智能犯错,代价比大语言模型高得多。”

/ 01

ChatGPT为什么能那么快火?

“因为它站在了巨人的肩膀上,”艾伦·杨说,“之前的互联网,已经把人类的语言知识全部数字化了。它只需要做个爬虫去爬互联网,就能获得这些知识。”

但物理AI没有这个“巨人”。

“任何人炒了个菜、开了辆车、扫了个地,不会把自己的动作数字化,然后放在互联网上让你去爬。而且物理空间还涉及隐私问题。”

所以,物理AI的突破点不在模型,而在训练方法。

“我们需要一个像DeepMind那样的强化学习突破——不用监督学习,通过两套AI系统从小白开始左右互搏,就能找到比人类更优的策略。”

而他选择用赛车来做这件事。

“当我们的车开到120迈的时候,你必然要问:这车开160迈的时候安全吗?反过来,如果我知道它开到160迈不安全,那我也不会让家人在出行时速120公里的时候开这辆车。”

物理智能犯错,代价比大语言模型高得多。大模型说错话,你笑一笑就忘了。自动驾驶在你小区里撞了,你一辈子忘不了。

在极限边缘测试AI,不是为了比赛,而是为了让消费者拿到更安全的产品。

中国在物理AI时代的王牌:供应链

历史不会重复,但总是押韵

/ 02

“过去二三十年,我们已经看到了好几轮这样的节奏。iPhone设计在加州,但产线在中国;无人机曾经美国领先,后来大疆出现了;电动汽车也一样。物理智能和机器人,很可能也是这个趋势。”

但光有硬件不够。

“我们的汽车自动驾驶,不只要知道在中国怎么做,还要知道在欧洲、美国怎么做。各个国家的人怎么开车,背后是更深层的文化差异。机器人也一样——中国、英国、德国、墨西哥的妈妈分别是怎么带孩子的?”

他提出一个“蓝海”:

物理智能公司需要重视国际文化差异,把人类背后的情感纽带,像互联网一样重新连接起来。之前,因为互联网,我们的语言和文字已经连接起来了。但我们的文化、我们的情感,目前很大一部分还是切割的。希望在物理智能的时代,我们能重新建立起新的纽带。

一个科学家的“非共识”:失败是最好的教材

大自然没有监督学习

/ 03

赛道上,一辆自动驾驶赛车冲出弯道,轮胎卷起尘土,车身划出失控的弧线。在大多数人眼里,这是失败。但在伯克利AI竞速项目主席艾伦·杨眼中,这是他最珍贵的教材。

“大自然没有监督学习,”他说,“大象妈妈永远不会给小象写一本课本,然后用梯度下降去摧残自己的孩子。动物世界里,新生的婴儿、小象,每一步都是摔跤的。没有摔跤,就没有站起来的那一刻。”

他有一个独特的思维方式:用训练AI的方式来理解人类学习,又用人类学习的方式来理解AI。

  • AI的“预训练” = 孩子的童年

  • AI的“监督学习” = 填鸭式教育(给标准答案,模仿、重复)

  • AI的“体验式学习” = 孩子学走路(在摔跤中估算自己的价值函数)

基于这个框架,他得出了一个“非共识”判断:

真正的智能,从来不是在安全的环境里被教出来的,而是在失控的边缘自己长出来的。

Open Claw为什么是“病毒”?

“前提是,你得知道‘验证’本身意味着什么。否则,风险太大了

/ 04

所有人都在讨论“怎么装龙虾”,但没人问“这东西验证过吗”?

艾伦·杨说得直白:“我不会用。Open Claw本质上就是个病毒。‘病毒’是个中性词,有的病毒能治癌症,只要它能精准找到你的痛点、解决你的痛点,它就是癌症杀手。但它也有未知的风险。现在Open Claw还没有经过充分验证,它去主动调用你的电脑,风险是比较大的。”

再酷的功能,没有验证,就是风险。不是不能试,但得知道“验证”本身意味着什么。

他提醒:不要只看到“它能在你睡觉后还帮你干活”,要看到背后的安全风险。

AR/VR为什么还卡在“一眼假”?芯片+硬件+视觉显示器是通关门票

“无论打造多好的产品,一定要迭代式开发

/ 05

产品市场fit的三个词:Product(工程师想做的)、Market(消费者认不认可的Aha moment)、Fit(值多少钱)。AR/VR折腾了这么多年,还没真正fit。

作为AR/VR领域的早期研究者,艾伦·杨对这项技术的判断很冷静:“任何人把AR/VR放眼前,一眼就能看出来是假的。什么时候算到了‘Aha moment’?你戴上装置以后,分不出来虚拟场景到底是数字生成的,还是眼前是真实场景。”

解决痛点需要新的芯片、新的硬件加速,和高清晰的视觉显示器做深度的绑定,要做纳秒级、毫秒级的优化,目前还没人跨过去。

艾伦·杨的忠告是:对无论打造多好的产品,一定要迭代式开发。不要憋大招,不要想一步登天。

读博还是工作?先想清楚时间花在哪

学术界的思维方式永远是跳跃性的。产业界要的不是跳跃式思维,而是迭代性的开发能力

/ 06

“现在的学生,最大的痛苦就在于找工作,”艾伦·杨直言,“十年、二十年前,只要你是顶尖工科学校毕业,基本是铁饭碗。但现在不一样了。AI出来了,它不但不需要那么多新鲜血液去滋养,甚至可能把老的树干也替换掉。”

他经常被学生问一个问题:要不要读博?

“很多学生看到AI火了,看到做AI的都是博士,就得出结论:我也要读博。但问题在于,你要花五年时间。这期间,你在学术界用8块GPU算未来5年、10年的问题,但压根没登上今天的列车。等博士读完,AI早就不是今天的AI了。

他的建议很朴素:做自己喜爱的事。

“如果你喜爱去公司里工作,直接就去公司。虽然会很痛苦,但至少是痛并快乐着的。如果读博只是为了换一张现在心仪职位的入场券,五年后等你走出来,那个位置可能早已不属于这个时代。”

在AI的快速变革中,每一个犀利观点,都是帮助我们保持清醒的工具。
浏览完整内容及更多观点,欢迎点击阅读原文浏览世界人工智能大会(WAIC)首份刊物《WAIC UP!》——一部面向未来的AI时代进化指南。
  • 可在微信小店购买纸刊
  • 也可扫码在线阅读

扫码进入#06期《WAIC UP!》

解锁10篇AI时代最实用的解决方案

Hello:

世界人工智能大会(WAIC)推出首份刊物《WAIC UP!》,一部「AI时代进化指南」。

WAIC UP! WAKE UP MORE!

我们邀请全球AI及跨领域的先锋力量,共同释放思考的力量与智慧的主张,旨在唤醒更多人,探究关乎技术跃迁、自我边界和未来文明的无限可能。

准备好!释放你的思考,觉醒你的行动,与我们一同探究那些尚未显现的可能性,勾勒以人为中心的未来智慧文明全景图!

点击阅读原文成为WAIC会员