一切都是同一件事。
这句话像物理学的口号,也像今天理解 AI 的入口。
粒子物理学家 Don Lincoln 在 Lex Fridman 的播客里讲宇宙:牛顿、麦克斯韦、希格斯、暗物质、暗能量。听到最后,我想到的不是另一篇物理科普,而是一个更适合 AI 时代的学习问题:我们到底怎样把碎片组织成理解。
physics 问力能不能统一;AI 问任务能不能统一;语言学习问,单词、语法、听力、口语能不能在更深处变成一种语感。
Don 讲的第一件事,不是方程式,而是一个历史模式。物理学的故事,可以用一个词概括:统一。
牛顿之前,天上的行星运动和地上的苹果下落,是两回事,两套解释。牛顿说,不,是一件事,叫万有引力。那个“万有”二字不是修饰,是宣言。
两百年后,麦克斯韦把电和磁放进同一组方程。闪电和冰箱贴,看起来相隔很远,但在更深的层次上,它们是同一个电磁场的两种表情。
如果要把这句话放进今天的语境,我会保留它的英文骨架:Unification is not simplification; it is a deeper way of seeing difference.
统一不是简单化;它是一个更深的看见差异的方式。
这也是 AI 给人的震动。过去我们把任务分得很开:翻译是翻译,摘要是摘要,问答是问答,写代码是写代码,看图是看图。
后来大模型把这些任务拉进同一个空间。文本、图像、声音、代码,都可以被转成某种向量表征,再从这个表征空间里重新展开。
LLM 不是把差异抹掉,而是找到差异之间可以互相转换的底层形式。翻译是意义的迁移,摘要是信息密度的重排,写作是模式的重新组合,图像理解是视觉信号进入语言关系网。
看起来是很多任务,本质上是同一种运动:把输入压缩成关系,再把关系展开成输出。
再往后,弱核力和电磁力又被合并,叫电弱力。这个统一更微妙:在高能状态下,它们本来是一种相互作用;宇宙冷却之后,对称性破缺,它们才显得如此不同。
光子没有质量,可以传播很远。W、Z 玻色子有质量,弱相互作用只能走很短的路。统一还在,只是表面变了。
这像大模型的能力。底层可能只是一个统一机制:预测下一个 token,学习上下文里的统计关系。但进入具体任务,它就“破缺”成翻译、解释、辩论、写诗、写代码、陪练口语。
能力看起来不同,不是因为模型里面住着许多小专家,而是同一个表征系统在不同语境、不同指令、不同约束下,显现成了不同形态。
所以我会把这一句放在这里:Grammar is the symmetry behind sentences; usage is where the symmetry breaks.
语法是句子背后的对称;用法是这个对称发生破缺的地方。这个译法有点硬,但它保留了物理感,也保留了语言学习里最难的那一层。
Don 还讲了一个古猿的比喻。想象两百万年前的南方古猿,站在非洲某处,身高一米。他知道脚下这片土地,往前走一公里没问题,走一百公里也许还行。
但如果让他预测五百公里外的印度洋,预测阿尔卑斯山,预测南极洲,他压根不知道那些东西存在。
Don 说,我们现在也有点像那只古猿。我们能测量的粒子能量,和验证“万物理论”需要的能量,相差一千万亿倍。
这句话对 AI 也成立。我们看见了模型的能力,却未必真正知道能力来自哪里;我们看见了涌现,却未必知道涌现的边界;我们在当前尺度上解释智能,就像古猿站在草地上猜测企鹅。
所以 Don 喜欢一句话:你绝对不应该相信你自己认为是对的东西。理论要被测量撞一下,学习也要被使用撞一下。
1964 年,希格斯和另外几位物理学家提出一个想法:空间里充满了一种场,有些粒子与它相互作用,因此获得质量;有些不作用,比如光子,所以没有质量。
这个想法解决了一个理论难题:弱核力和电磁力明明是同一件事,为什么表现差异这么大。答案在希格斯场里。
证明它存在,花了将近五十年。费米实验室和 CERN 都在追这个粒子。Don 所在的团队已经把范围缩到很小,再给两三年,也许他们就能做到。
但 2012 年 7 月 4 日,CERN 宣布发现希格斯玻色子。费米实验室差了两天。Don 讲到这里没有遗憾,他说,那就是科学的样子。
这段故事放到语言学习里,我想到一句话:A word has no mass until it meets context.
一个词没有质量,直到它遇见语境。单词表里的词,像没有质量的粒子,轻得抓不住;它进入句子、场景、人的动机和情绪之后,才开始变重。
这也是 AI 对语言学习真正有用的地方。它不是替你学,而是把原本隐藏的结构放大给你看。
以前你背一个词,只看到一个孤立释义。现在你可以让 AI 给你十个语境:正式的、口语的、讽刺的、文学的、新闻的、面试的。你会发现同一个词在不同场里弯曲、变形、换重量。
以前你学语法,像在背规则。现在你可以让 AI 生成最小对比句:为什么这里用过去完成时,那里只用一般过去时;为什么这里用 which,那里用 that;为什么这个介词听起来别扭。
以前你练口语,最缺的是反馈。现在 AI 可以变成一个低成本实验室。你说一句,得到反馈;你改一句,再得到反馈;你试探一个表达是否自然,就像实验物理学家试探一个理论是否站得住。
所以这句英文应该穿在这里,而不是放在结尾:AI does not abolish language learning; it exposes what language learning has always been: the building of a field of relations.
AI 并不废除语言学习;它暴露出语言学习一直是的东西:一个关系之场的建造。
Don 讲反物质时,故事突然变得很干净。每次粒子加速器产生物质,它同时产生等量的反物质。照这个逻辑,大爆炸也应该制造了等量的物质和反物质,然后它们相互湮灭,什么都不剩。
但我们在这里。
根据宇宙微波背景的测量,大爆炸产生的每十亿个反物质粒子,对应了十亿零一个物质粒子。多出来的那一个,就是整个可见宇宙。
语言学习里也常有这样的“不对称”。你读懂一百句,能说出来的可能只有一句;你听过一千次自然表达,真正变成自己肌肉记忆的,也许只有一点点。
但那一点点不是失败。它就是宇宙里多出来的那个一。
暗物质的故事更像侦探小说。星系旋转得太快了,按照我们看到的物质计算,它们应该被甩散,但它们没有。
要么我们不理解引力,要么那里有大量看不见的物质。子弹星系团的证据让 Don 改变了想法:气体云因为碰撞留在中间,引力畸变却跟着星系走,不跟气体云走。看不见的东西,留下了可见的轨迹。
语言里也有暗物质。你听母语者说话,会觉得自然;你自己造同样意思的句子,却觉得硬。差别常常不在词典,也不在语法表,而在搭配、语气、节奏、隐含前提、文化脚本里。
暗能量也一样。宇宙膨胀不只是在继续,还在加速。物理学家给它起名叫暗能量,但名字不是解释,只是承认:那里有一个我们还没理解的力。
学习中也有这种力。你以为自己在背单词,其实真正推动你走远的,可能是好奇心、挫败感、某一次听懂的快感,或者一个人突然发现“我也可以”的时刻。
对话最后,Lex 问 Don 的成长经历。故事从宇宙尺度突然落回一个美国农村孩子。
他的父母都没上过大学。妈妈在他六七年级时就辅导不了数学了。但他一天读一本科幻小说,把妈妈愁坏了。科幻给了他想象力,阿西莫夫、卡尔·萨根、乔治·伽莫夫给了他通往科学边疆的门。
他上大学时辅修哲学和神学,因为真正想回答的问题是:宇宙从哪来,为什么是现在这个样子。后来他意识到,哲学和宗教给不了他想要的那种答案,于是成了科学家。
研究生阶段,他周一到周六,从早八点待到午夜,周日下午五点才离开,因为要洗衣服买菜。他说:我爱这件事。如果我有钱,我还是会这么干。
现在他写书、做视频,是因为他知道美国某个角落,还有另一个没受过良好教育的孩子,可能会因为看到一点东西,走向他走过的路。
不是物理学可以解释 AI,也不是 AI 可以解释语言。更准确地说,它们分享了同一种动作:把碎片放进一个场里,让关系显影。
这句英文可以放在最后,但它不是总结,更像一个方法:What physics calls a field, AI calls a representation, and language learners may call a feel.
物理学叫它场,AI 叫它表征,语言学习者也许叫它一种 feel。这里不把 feel 翻掉,是因为语感本来就不是一个完全可翻译的东西。
学习不是堆更多碎片,而是让碎片开始互相吸引。
The goal is not to memorize more fragments, but to find the force that makes them belong together.
目标不是记住更多碎片,而是找到那种使它们归属于一起的力。
Don Lincoln 喜欢实验,因为实验会把漂亮理论撞得疼一点。语言学习也一样。不要只相信自己懂了,要把它说出来、写出来、放进交流里,让现实给你反馈。
To learn is to compress many encounters into one portable intuition.
学习,是把许多次相遇压缩成一个可携带的直觉。
夜雨聆风