谷歌的AI逆袭:从发明Transformer到差点被淘汰
谷歌的AI逆袭:从发明Transformer到差点被淘汰
2026年4月8日,谷歌CEO劈柴接受了知名投资人Elad Gil的采访,谈话接近2个小时。这是谷歌推出Gemini 3之后最长的一次CEO访谈。劈柴分享了谷歌在AI大战里先大幅落后、再追赶的经过,非常值得参考。
领先:Transformer本来就是谷歌的
Transformer算法最早诞生于谷歌,那是2017年。可后来首先把Transformer用得风生水起、吸引千亿美元投资的是OpenAI。谷歌不就白白浪费了自己的创造吗?
谷歌的看法是随时间变化的,外界的误解也很多。
第一种误解就是”为别人做嫁衣”。
实际上,2017年Transformer刚诞生的时候,谷歌马上就用起来了。因为Transformer压根就不是纯学术象牙塔搭出来的。
当时的背景是,谷歌正在考虑把语音搜索当成产品推出。语音识别的准确度在当时已经做得比较完美了,唯一的担忧就是识别成本太高,于是才去和博通一起研发了TPU处理器。
可你发现没有?一旦你开始用嘴说话,口头语、非逻辑性的表达比例就开始暴涨了。谷歌那时想实现的是:人们对着手机用自己的话说就能提问,而且谷歌还能提供很准确的搜索答案。那就要把这段话说的是什么在算法上搞清楚,否则搜索结果质量一定非常低下。
当年的Transformer算法马上就用起来,做出了BERT这个语言模型,用来处理从语音识别出来的文字背后的意义,然后送去搜索引擎找答案。
所以谷歌搜索引擎对那些纯自然语言表达的、缺乏逻辑的内容的处理,从2019年开始产生了一个质的飞跃。
只是那时候,大部分老用户还固守着传统方法,尽量去想一些跟目标答案有关联的关键词,通过各种跟自然语言表达完全相悖的技巧让搜索引擎找出满意的答案。大家谁都知道,用平常说话的方式直接问搜索引擎效果肯定不如自己原来的方式好。
客观地说,2019年的时候你把传统搜索技巧用到极致,得到的答案质量依然明显高于谷歌用BERT模型处理自然语言后给你的答案。但两者的差距缩小了——从前是100分和10分的差距,2019年之后缩小到100分和80分的差距。

迟疑:软件创新没有壁垒?
接着,谷歌在2020年也注意到了OpenAI的崛起。他们发现Transformer被OpenAI开发成了一个聊天工具,这是他们没想到的。谷歌之前只把Transformer当成搜索引擎质量提升的工具。
紧接着,谷歌内部也做了一个聊天工具LaMDA。不过并没有对LaMDA做太多人类反馈强化学习,也就是没有做把聊天内容合法合规的那些后训练。从LaMDA的初步表现看,谷歌评估这种聊天工具毒性太大,很难做到推给20亿用户还能合法合规,所以并没有自己堆人力去开发后续功能。
谷歌始终有一个信念导致他们忽视了OpenAI的崛起,就是认为软件创新是没有壁垒的。
什么意思呢?比如谷歌自己就经历过,当年费了很大力气做视频搜索,但YouTube崛起了,谷歌马上就不用自己搞了,直接把YouTube买下来。当年Facebook看到Instagram崛起了,也没有费劲效仿,而是直接把Instagram收购了。所以谷歌认为软件是没有门槛的。
当然OpenAI的情况有点特殊,它不太好收购。因为OpenAI的诞生最早是源于谷歌收购DeepMind跟马斯克结怨,马斯克才成立的OpenAI。所以OpenAI之后肯定不可能再接受谷歌的收购邀约。但总归是Transformer下的蛋吧?除了OpenAI还会有这个AI、那个AI的,到时候谷歌挑一个最好的收购就可以了。
这就叫软件创新没有壁垒。因为创新的核心内容是智力内容,是算法、是想法、是人,把这些人收归旗下就可以了。
谷歌认为,真正有壁垒的是类似苹果那样的企业。它做出来一个iPhone4,看着好像是个小小的东西,但背后是极其庞大的重资产、深厚的专利积累、漫长的全球供应链管理,绝不可能是几个幸运的工程天才在车库里搞3个月就能弄出来的东西。
于是,在这种惯性思维下,谷歌依然不着急搞自己的聊天形态的AI。
但2022年后,随着GPT的发布,以Transformer为基础的创新公司再也不是软件创新了,开始呈现出”重资产”的特征。因为要满足用户使用,背后训练、推理的算力越来越夸张,今天的规模甚至已经大大超过了苹果。
这边是谷歌对聊天工具的忽视,那边OpenAI和微软绑定之后却发现了新的动向——这个模型的能力如果继续增长下去,可远不只是一个聊天工具,而是在一些工程领域有实际的替代作用。
这个新动向谷歌当时也错过了。为什么?因为微软的存在。全球最大的代码库是GitHub,微软在2018年以75亿美元重金收购来的。正因为OpenAI跟微软在投资上深度绑定,OpenAI才能拿到很多源代码做训练数据。而OpenAI也是最早注意到Transformer模型会在编程上有大发展的。于是,一个聊天工具会升级为一个自动写代码的工具。如果算力再给足,那Transformer的远景就相当于全人类程序员的价值了。
这个趋势OpenAI从2022年就观察到了,于是无论从研发角度还是扩大投资角度,都加了10倍、100倍的力量。
那个时候,谷歌有点手足无措,慌忙发布了几个版本的Gemini,表现都是令人失望的。

追赶:DeepMind这颗种子
转折发生在2023年初,谷歌决定把DeepMind跟谷歌大脑合并。整合后的新部门叫Google DeepMind,由总部在伦敦的DeepMind直接领导。
一般来说,巨头在犯了大公司病之后,面临对手具有威胁的竞争,就算是怎么拆分、怎么整合,最后的核心变革都是一顿人事斗争和瞎折腾,几乎没有什么得到好结果的。
谷歌通过合并之所以扭转了颓势,关键就是DeepMind。因为它在谷歌内部十年了,却一直是极为独立的。从他们一直以伦敦为本部、拒绝搬家到硅谷做科研就可见一斑。公司大了都免不了有大公司病,而DeepMind是谷歌内部唯一一个没有染上大公司病的部门。尤其是合并后也仍然是DeepMind做主导,就更避免掉入到之前的模式中了。
也多亏谷歌在内部十年来一直精心养育了一个良好秩序的种子。DeepMind之前完全不承担任何产品KPI考核,但他们的研发方向又不像是学术象牙塔里堆论文数量、水期刊等级,而是一直聚焦在离实用产品最近的技术革新上。
对谷歌来说,要争夺AI竞赛的冠军,硬件条件一个也不少:顶级研发人才、足够多的一流成果、顶级的硬件TPU而且是自研的不受卡脖子、还有足够多的钱——比如今年就是1800亿美元去部署算力。
谷歌唯一缺的就是调配这些顶级资源的管理方式。之前的管理工作被大公司病消耗掉了。而DeepMind的哈萨比斯接手之后,谷歌的AI部门更像是一个高度类似OpenAI的初创公司,决策快,迭代也快。
今天AI领域真正可以算是扛把子的——OpenAI、Anthropic、谷歌的AI部门,它们都是初创型的。xAI虽然也算是AI巨头,但管理方式和典型巨头略有不同,完全是马斯克一手遮天。这种专制高压当然很多人不舒服、不认同,但对于一个公司的治理来说,它确实是对抗大公司病很有效的方式。
作为鲜明对比的,比谷歌更早几年入局的巨头微软,到现在反而是竹篮打水一场空。Meta是另一个在大公司病下对AI野心勃勃、然后搞到一团糟的典型。
未来:钱不是问题,花不出去才是
劈柴还谈到了谷歌2026年之后的发展。
他们给2026年准备了1800亿美元的花费,其中肯定大部分是给AI的。但当前的形势是,每个AI巨头都在这个规模上规划了今后几年,他们每个公司都能吃下全球晶圆的全部产能。
所以谷歌是最典型的:钱根本不是问题,完全可以给2026年规划更多比如4000亿美元的支出。但问题是根本花不出去,因为那边基础设施的产能是有限的。最难的当然是芯片,其次的难点就是能源和电力。
劈柴还专门提到了中国。他说看到中国的建设速度会让人产生敬畏,觉得需要学会更快地建设东西,转换思维方式,应该先去想——把建设速度提升到当前的10倍需要哪些条件。
由于基础建设的速度受到强烈制约,造成了很多有意思的现象。
首先就是互联网巨头公司内部出现了尖锐的算力争夺战。最尖锐的矛盾发生在”云服务”和”AI训练与推理”这两个部门之间。云服务部门天然地认为自己所需要的算力是和外部公司签署的具有法律意义的合同所需求的,应该优先满足。而AI训练与推理部门认为,自己将是今后公司的绝对支柱。所以绝大部分公司的CEO今天最头疼的就是给这两个部门协调算力配比。
而且由于算力紧张,今天AI巨头也不可能把所有研发出的新品推向所有用户,甚至连公司内部都有内圈和外圈之别。起码在谷歌,DeepMind团队和一部分软件工程团队已经把一个智能管理器”反重力”用了好几个月了,而谷歌传统的最大业务——搜索团队才刚刚拿到这个工具不到一个礼拜。
这个现象在任何公司都存在:有些人还停留在”AI只是一个聊天工具”的认知程度上,而有些人已经开始用AI工具做很多实际工作了。
劈柴回顾了谷歌自己先领先、再落后、再追赶的过程。对我们来说也能意识到,关键技术被发明出来之后,真正的胜负远远不是算法效率、模型性能之类的指标。今天一整套全新的工业体系的雏形已经出现,这里既包含了能源和芯片的基础设施,还包含了部署能力、组织效率、产品服务等等比榜单复杂得多的部分。
夜雨聆风