

4月7日,Alphabet兼谷歌首席执行官Sundar Pichai接受了Stripe联合创始人John Collison与投资者Elad Gil的对话访谈。本次对话深入探讨了谷歌在AI竞赛中的全栈竞争力、Transformer架构的起源与真实商业回报、搜索业务向AI Agent的范式转型、年均1800亿美元资本支出的底层逻辑,以及算力供应链的物理瓶颈等话题。
Sundar Pichai指出,Transformer架构的诞生并非纯粹的实验室研究产物,而是为了解决谷歌翻译与语音识别在TPU上的推理效率瓶颈。他反驳了“谷歌未能从该架构获益”的观点,强调谷歌早已通过BERT和MUM等模型实现了搜索质量的跨越式提升,并获得了巨大的投资回报。
Sundar Pichai表示,垂直整合是谷歌的核心战略,公司正处于从模型、基础设施到应用的指数级进化周期中。他认为延迟是衡量产品底层架构稳健性的关键指标,谷歌在增加功能的同时将搜索延迟降低了30%,这是核心竞争力的体现。
针对1800亿美元的巨额资本支出,Sundar指出,目前的投入并非盲目扩张,而是受到晶圆产能、能源供应、行政许可及内存产出的硬性物理约束。他认为内存是当前最关键的短缺组件,这种供应限制正迫使行业进入效率提升的压缩周期。
他预测,到2027年,AI Agent将深度重塑企业管理工作流,实现无人工干预的自动化业务预测。同时,搜索框在未来十年可能消失,搜索业务将从“单行提示词返回结果”进化为管理大量长期、异步任务的“AI Agent 任务执行器”,未来的交互界面将由底层编码模型和安全框架重新定义。
01
谷歌早已从 Transformer 架构中获得巨大的搜索回报
在谷歌与AI 发展的历史中,人们常讨论 Transformer 架构虽诞生于谷歌,却在公司外部通过 ChatGPT 等产品实现了商业化。你对此有何感悟?此外,你们是否已经完成了相关研究并从中获得了预期的投资回报?
Sundar Pichai:这确实是个值得探讨的话题,其中存在不少误解。Transformer 是在大量 TPUs 研发的背景下诞生的,在很大程度上是为了解决特定的产品需求。当时团队正致力于提升翻译质量。以 TPUs 为例,当语音识别技术成熟并需要推向 20 亿用户时,我们面临芯片短缺的挑战,必须攻克推理效率的难关。它出自我们的研究团队,但其核心驱动力是解决产品瓶颈。
Transformer 问世后立即投入了实战。人们往往低估了 BERT 和 MUM 的影响力,因为我们对搜索质量的衡量极其严苛。在谷歌搜索大幅领先行业的阶段,搜索质量的几次重大飞跃正是由 BERT 和 MUM 驱动的。我们构建了 Transformer 并迅速应用于搜索业务,以增强对语言、网页内容及用户查询的理解,并在此基础上持续迭代。同时,我们也开始了内部产品化进程,例如 LaMDA 项目。虽然我们并非首个对外发布此类 AI 的公司,但这并不代表我们只做研究而不顾产品。
关于产品化进程,我想补充一点,我们甚至完整构思过类似 ChatGPT 的产品,那就是 LaMDA。如果你还记得,当时内部有一位工程师认为 AI 具有感知力,他当时交流的对象可以看作是 ChatGPT 的早期版本。在我们的产品路线图中,类似的产品早已存在,谷歌最终在约九个月后正式发布。事实上,在 2022 年的谷歌 I/O 大会上,我们推出了名为 AI Test Kitchen 的实验室产品,其核心就是 LaMDA。由于当时内部尚未完成经过 RLHF 处理的端到端版本,出于安全性考量,我们对其进行了严格限制。当时的测试版本表现出了一定程度的攻击性,在那个时点我们无法将其公之于众。
此外,作为一家对搜索质量有极高标准的公司,我们对产品发布的门槛设定得更高。我们在探索最佳发布路径的过程中,OpenAI 与微软达成了协议。回看过去,这一切在当时并非显而易见。我认为他们在 GitHub 的代码端捕捉到了关键信号。这可能是我们当时忽略的一点,在代码领域,能力的跨越式提升比单纯在语言领域更为显著。如果你将 AI 用于编程,GPT-2、GPT-3 乃至 GPT-4 之间的代差会更加突出。所以,我认为这不仅是研究转产品的问题,更是多重因素共同作用的结果。
ChatGPT 的低调发布及其后续的爆发让所有人感到意外。你如何理解这种“惊喜时刻”在行业中的地位?
Sundar Pichai:我对这些时刻的理解是,在消费级互联网行业,惊喜总是常态。当年我和埃拉德在谷歌时,YouTube 出现了,随后我们完成了收购。再看脸书,当 Instagram 崛起时情况也类似。现在人们看待这些往事已不再觉得具有戏剧性,纯粹是因为脸书买下了它。
在消费级互联网领域,随时可能有几个人聚在一起做出原型并在无数尝试中脱颖而出。我并非要贬低任何成就,但这类时刻必然会发生。车库创业者或许很难制造出比 iPhone 更好的硬件,但在消费级互联网领域,情况完全不同。你必须意识到这种行业节奏并将其内化。
02
Gemini与搜索的未来形态
谷歌长期将速度作为核心竞争力,从早期的搜索耗时展示到现在的Gemini。站在 2026 年,基于 TPUs 运行的 Gemini 在速度上依然出众,这是否是一种明确的产品战略?另外,搜索团队在功能大幅增加的情况下是如何平衡延迟预算的?
Sundar Pichai:我始终将延迟视为卓越产品的关键特征,它反映了底层技术架构的稳健性。此外,发布、迭代和更新周期的速度也同样重要。在不断提升能力的同时平衡延迟是极具挑战的,这就涉及到了Scaling Law 的平衡。
关于延迟预算的分配,以搜索团队为例,子团队拥有毫秒级的延迟预算。如果你开发的功能削减了 3 毫秒耗时,你只能为预算赢得 1.5 毫秒,剩余的 1.5 毫秒则回馈给用户。根据任务类型,有的团队预算只有 10 毫秒,且必须通过极其严苛的审查。过去五年,我们在功能大幅增加的情况下,依然将搜索延迟降低了 30%。这就是我们在 Gemini 中坚持的原则,确保能力与速度并存。我们的 Flash 模型已具备 Pro 模型约 90% 的能力,但速度更快且部署成本更低,垂直整合在其中发挥了巨大作用。
现在许多人将聊天视为新界面,虽然搜索已经整合了AI 结果,但目前的讨论热点是 AI Agent 流程,未来每个人都将拥有直接执行任务的私人代理,比如不再是提供旅行攻略,而是直接预订行程。你如何看待搜索的未来?它会是一个分发机制,还是某种全新的产品形态?十年后搜索框是否还会以目前这种“输入单行提示词并返回排名结果”的形式存在,抑或是进化成完全不同的形态?
Sundar Pichai:我认为每一次技术变革都让搜索的能力边界得以拓宽。我们必须不断吸收新能力。以移动端转型为例,当用户走出地铁站时,他们需要的不是网页链接,而是具体的行动指引。未来,大量信息查询在搜索中将演变为AI Agent 化的任务执行。
它会持续演进。搜索将成为管理大量事务的管理器。我目前就在使用一些 AI 协作系统,有一群 AI 在执行任务。我可以预见搜索也将演变成这种模式,高效地帮你完成事务。但在目前的 AI 搜索模式中,用户已经开始进行深度研究查询,这超出了原本的定义。用户正在适应这种变化,开始执行长期且异步的任务。
(关于未来的交互界面)设备的形态和输入输出模式必将发生巨变。预测十年后可能会让人决策瘫痪,但我们可以聚焦未来一年,因为技术曲线非常陡峭。模型在一年内就会发生天翻地覆的变化。顺着这条曲线前行本身就充满激情,这并非零和博弈。人们通过 AI 创造价值的能力正处于爆发式增长的曲线上。只要你持续创新并处于最前沿,增长空间就会不断扩大。就像抖音出现后,YouTube 依然表现出色。我们正在并行推进搜索和 Gemini,它们虽有重叠,但在未来会走向截然不同的路径。
03
谷歌2025 的转折点
回想2025 年春夏,市场对谷歌的情绪非常负面,认为搜索业务正遭受降维打击,谷歌股价一度徘徊在 150 美元。但现在人们看到谷歌拥有从应用、模型到 TPUs 的全栈能力,还有 Waymo 和 YouTube 等业务。你认为投资者在去年误解了什么?是 Gemini 2.5 或 Gemini 3 的发布让外界彻底改变了看法吗?
Sundar Pichai:当时市场过于关注短期波动,但对我而言,奥弗顿窗口(Overton Window)已经发生了位移。公司正是为这一时刻而建的。垂直整合战略并非偶然,我们当时已在研发第七代 TPUs。早在 2016 年我们就明确了建设 AI 数据中心的蓝图,公司一直以 AI 优先的方式运营。
我们在前沿模型方面曾一度落后,但内部技术储备深厚。从全栈角度看,我们拥有研究、基础设施和所有核心平台。AI 是一项共性技术,它可以全面加速搜索、YouTube、云服务到 Waymo 的所有业务。我从不认为这是一个零和时刻。相反,一切都将迎来十倍级的增长,市场容得下其他竞争者。正如谷歌崛起后,亚马逊和脸书依然取得了巨大成功。我们往往低估了行业的增长前景,但作为一家公司,我们必须在执行力上做得更好。
(关于转折点的标志)我认为真正的转折点可能是 Gemini 2.5,特别是在多模态领域的前沿表现。这要归功于谷歌 DeepMind 团队。我们前期投入了巨大的固定成本,但从第一天起就将 Gemini 设计为原生多模态。随着 Nano Banana 等 AI 的整合,这种技术优势开始全面显现。这是一个动态的前沿阵地。两三个顶级实验室正在激烈角逐,每个月都可能互有领先。这种竞争态势非常激烈,正如我们所预期的那样。
04
AGI时刻
其他实验室常觉得谷歌并不那么深度认同AGI 愿景,这是否影响了你们构建产品的方向?此外,现在科技高管们都处于一种极度的 AI 狂热状态,在你的感知中,有哪些瞬间让你觉得触碰到了AGI?
Sundar Pichai:我们将资本支出从300 亿扩大到了约 1800 亿,如果不相信这条技术曲线,就不可能做出这种规模的投入。这在很大程度上只是表达方式的差异。由于我们体量巨大且产品触达广泛,沟通方式可能更稳健。但我们的创始人绝对是 AGI 的坚定信徒。在谷歌,我们对 AGI 的认知从未缺失。
那种质疑在我看来并没有意义。部分原因在于,如果你是一家新兴公司,或者更倾向于纯粹的研究实验室,你可能会将总部设在旧金山。这些细微的属性确实会产生一些影响,但在基础层面,无论是对技术曲线的预判,还是我们对技术的内化方式,眼界上并没有区别。事实上,即使在公司内部,也有一群人始终站在最前沿。我们不断启动 AI Agent,观察其能力边界,见证 AI Agent 习得新技能并处理复杂任务。对比三个月前后的表现,我们正在内部亲身经历这种指数级的技术进化。
(关于感知 AGI 的瞬间)我第一次感知到 AGI 的瞬间是在 2012 年,当时 Jeff Dean 展示了 Google Brain 的最早版本,那是神经网络首次识别出猫。2014 年左右,我与 Larry 参加了自动驾驶挑战赛,目睹了车辆在现场行驶。随后 Demis 展示早期模型时,模型表现出了我们所谓的想象力。类似的时刻有很多,技术进步是显而易见的。如果说当下最切身的感受,我认为是在编程时。当你交给 AI 一个复杂的任务,你甚至不需要打开集成开发环境,而是处于某种 AI Agent 管理环境中,看着它高效完成任务,那种力量感非常震撼。你可以将其称为感知到 AGI,确实会有那样的瞬间。绝对有这种感觉。真正让人惊讶的是技术曲线的斜率,我们在如此多的范式上进行改进,未来的进步空间非常清晰。
05
CEO的管理工具箱
作为CEO 往往面临信息脱节的风险,不能只靠团队报告或电子表格来管理。你如何确保自己不脱离实际的产品体验?除了日常使用 Gmail,你有哪些特殊的调研方法?
Sundar Pichai:我会进行深度的内部试用,也就是使用内部版本。我会专门抽出时间,高强度、专注地试用产品。这非常有帮助。就在两周前,我在健身房拉伸时,拿着装有Gemini Live 的手机,针对一个话题与它聊了整整 30 分钟。你会做这类尝试,有些表现惊艳,有些令人抓狂,但你能学到很多。我强迫自己以超级用户模式去试用,以此保持触感。X 平台也很有用,因为在那能听到最直接的原始反馈。
(关于处理用户反馈的方法)X 平台能提供最直观的评论,我会亲自关注。我告诉你一个很有用的方法,在内部我会调用 Antigravity,这是我们内部版的分析工具。我会查询,我们上线了这个功能,大家怎么看,告诉我讨论最多的五个缺点和五个优点。输入指令后,结果就出来了。我的生活确实因此变轻松了。在过去,我要花很多时间才能摸清用户感受。现在, AI Agent 在帮我完成这个过程。你必须权衡自己该花多少时间去亲自感受,以及这些工具是否真的发挥了作用。我也在经历这个过程,努力适应这个未来。
06
AI 对美国经济的真实拉动
回顾以往技术周期,互联网或SaaS 往往要很久才体现在 GDP 数据中。但在 AI 领域,我们从数据中心建设规模就能看到对经济的拉动。你如何展望未来三到五年,美国经济会因为 AI 而变得更大吗?如果会,规模会增加多少?此外,如何看待巨大的资本支出与回报之间的对齐关系?
Sundar Pichai:要让这些投入产生意义,回报必须在某个环节体现。大概两年半前,红杉资本有人写文章说,人们的投入规模非常巨大。当时的观点是这不合理,因为你需要同等规模的回报,可能得达到投资额的10 倍。从那时起,我得再去查查数据,但在某个时点,两者必须对齐。需要明确的是,我们现在正处于供应受限的状态,全方位的需求都在爆发。
(关于经济增长的预判)我明白。回看互联网对经济的影响,数字并不能完全捕捉我们对互联网的真实感受。也许如果没有互联网,经济增长甚至是负的。很难预判未来。我认为社会各层面都存在天然的抑制机制。显而易见的是,算力基础设施的建设曲线与模型改进的速度曲线并不是同步的,你已经在应对一条更受限的曲线了。此外,如何将技术负责任地渗透到社会中也是挑战。我们正在通过 Waymo 自动驾驶实践这一点。你可以让 Waymo 比人类司机更安全,但部署节奏必须非常谨慎。如何负责任地在社会中普及技术,这些环节都存在约束。美国经济比 10 年前大得多,即使 AI 能额外贡献半个百分点的增长,那也是极其巨大的。我预计情况会这样演变。
07
谷歌庞大的资本支出与2026年瓶颈预测
谷歌公布的资本支出预测在1750 亿到 1850 亿美元之间。即便想花 4000 亿,可能也因为内存产能不足、电力供应短缺及组件缺货而花不出去。你能具体列举一下这些瓶颈吗?此外,内存是否是你目前最担心的组件?
Sundar Pichai:甚至连合格的电工数量都不够。在某种程度上,你得追溯到最底层的晶圆产能,这才是硬性的物理约束。晶圆投产是一个根本限制。电力和能源问题相对好解决一些。行政许可审批和监管环境的周旋可能是更大的约束,这决定了你做事的节奏。
(关于建设提速的挑战)我觉得我们正在取得巨大进步。对美国来说,这至关重要。有些外部地区的建设速度非常惊人,我们真的需要学会如何大幅提速。你必须转变心态,思考在物理世界中如何将建设速度提高 10 倍。我担心这会成为一个长期约束。而且阻力可能会越来越大,这不只是几个决策者说我们要快就能解决的。我会说是晶圆投产、许可审批的能力。但我认为政府在这方面做了很多工作,大家意识到必须提高效率。接着是供应链中的关键组件,内存就是一个例子。短期内我们确实受限,但市场会做出反应。我认为所有经营公司的人,无论你对 AGI 的前景有多乐观,都得面对现实,你的看涨预测到底有多少误差空间,你能承受多大的利润波动。因为世界上有很多不可控的外部因素,大家都在根据这些约束做调整。
(关于内存组件的担忧)内存绝对是目前最关键的组件之一。领先的内存芯片公司不可能在一夜之间大幅提高产能,所以短期瓶颈是必然的,但长期来看会缓解。我认为这些限制也会逼出很多创新,我们将使这些硬件的效率提升 30 倍,所有的进化都在同步发生。
如果未来的模型改进依赖于自我提升,即模型开始编写代码和数据标注,这是否会导致寡头垄断?目前看起来这成了一场看谁手里有算力的“抢椅子游戏”,你觉得领先者是否会因为扩张上限而被对手追上?
Sundar Pichai:这是一个合理的思考框架。顺便说一下,我们刚刚发布了Gemma 4,这是一个非常优秀的开源模型。在特定领先地区之外的市场,它的表现非常亮眼。Gemma 4 与前沿模型的差距,从时间维度上看,既很大,又没那么大。Gemma 4 是基于 Gemini 3 架构的,这很奇妙,你谈论的是一组能装进 U 盘里的权重数据。这是一种很疯狂的属性,它不像航天火箭那样是庞然大物。
(关于资本冲破约束的动力)正是这些独特属性让我去反思现有的框架。在推理端,你说的思考方式很合理。我确实认为每个人都在试图通过资本的力量去冲破这些约束,这种动力是巨大的。看,还有其他约束,比如安全。这些 AI 模型肯定会彻底颠覆目前几乎所有的软件架构。也许颠覆已经发生了,只是我们还没意识到。
你认为所有软件都存在安全风险吗?比如像SSH 这样被尝试破解已久的协议,AI 的介入会带来什么影响?
Sundar Pichai:我谈论的是普通软件和大型平台,其中存在大量的零日漏洞。系统中存在一些无法回避的客观限制。关键在于这些漏洞如何渗透到社会中,以及会带来什么后果。这里存在一些相似性。我认为系统中可能存在隐藏的约束,甚至可能遭遇冲击。即便如此,我依然坚信未来充满机遇。有时,约束反而能激发创意。这种被迫的压力,可能会引发一些原本不会发生的深度对话。仅就安全领域而言,我认为未来需要更多目前尚不具备的协作。可能会出现一个剧烈的转折点。这些挑战是无法回避的。
08
谷歌从太空到机器人的前沿布局
谷歌拥有一套非常出色的投资组合,包括SpaceX、Anthropic 和 Waymo。在内部,除了 AI 和 TPU,还有哪些不为人知、或者可能在未来产生重大影响的瑰宝?量子计算会在哪个领域产生最大影响?
Sundar Pichai:我们一直在尝试推动一些长期项目,尽管在最初发布时,它们看起来有些异想天开。我们正处于探索太空数据中心的极早期阶段。回到刚才说的约束激发创意,如果你放眼未来20 年,你会把这些庞大的数据中心安置在何处,这些都是极难攻克的课题。现在的这类项目,就像是 2010 年时的 Waymo。量子计算本身也是此类项目之一。我们正投入巨大精力稳步推进,我对此充满期待。
(关于量子计算的影响力)在抽象层面,我认为量子计算是为了更好地模拟自然。既然自然界本质上是量子的,就需要量子系统来更精准地进行模拟。虽然我们可能会通过经典计算技术或高效的压缩算法,以一种出人意料的方式达成目标,但我从根本上认为量子计算在该领域更具优势。我们至今仍未完全掌握用于生产化肥的哈伯法中的复杂机制。直觉告诉我,在模拟天气、模拟现实等领域,量子计算将具有天然优势。只要量子计算能真正落地,它的应用前景将极其广阔。
(关于机器人与生物制药)谷歌 DeepMind 团队正在深入探索机器人技术。谷歌在机器人领域曾因进入过早而受挫,事实证明,AI 是十几年前那些想法中缺失的关键环。现在的 Gemini 机器人模型在空间推理等方面已达到业界领先水平。我们正与波士顿动力、Agile 等公司开展深度合作。此外,我们还在投资 Wing 的无人机交付,预计不久将有 4000 万美国人享受到这项服务。还有 Isomorphic,我们的思路是利用这些专用模型,优化药物研发中的所有关键环节。虽然临床试验依然漫长,但我们可以大幅提升研发的成功率。
优秀的资本配置应当是将机会成本内部化,并将现金流投向价值最高的领域。在谷歌,由于项目之间高度异质化,你如何比较YouTube 算法优化、Waymo 规模化以及新 AI 技术研发这些性质迥异的项目?你们是如何决定砍掉 Loon 项目而保留 Waymo 的,这背后是定性的直觉还是定量的量化分析?
Sundar Pichai:这是一个很好的问题。由于TPU 的分配需求,我现在感触颇深。在某种程度上,甚至 Waymo 也需要 TPU。计算资源的紧缺让这个问题变得非常紧迫。我非常期待 AI 能作为助手,为这类决策提供参考。一旦所有数据能够打通并流动起来, AI 已经具备了辅助决策的能力。关键在于如何解锁这些数据。回顾谷歌的历史,我们的优势之一是能在周期早期做出深度技术导向的决策。
当我们考虑那些长期愿景时,决策反而更容易,因为初始投入相对较小。关键在于保持长期的专注和投入,并确保在底层技术上取得实质性突破。以量子计算为例,我们设定了明确的技术指标,比如逻辑量子比特错误率(Logical qubit error)、纠错能力、达到大型稳定逻辑量子比特阈值的时间表,并评估团队的执行力。这就是我们的评估方式。我们一直很自律,非常看重对早期核心技术进行深度下注,这让我们受益匪浅。我们需要不断评估这些项目的长期价值。这在某种程度上更像是一种直觉驱动的判断,即评估 5 到 10 年后的期权价值和潜在市场总量,并在假设爆发式增长的前提下,审视当前的决策是否合理。TPU 的投资就是一个完美的案例,我们多年来一直在稳步推进。Waymo 也是如此,两三年前,当外界普遍转向悲观、纷纷撤资时,我们反而加大了投入。
(关于项目去留的量化评估)这涉及到量化评估。我们关注 Waymo 驱动程序的底层技术演进,即软件驾驶汽车的安全性和可靠性。这是一个长期的过程,我们紧盯着技术曲线,设定目标并评估实际表现与预期曲线的拟合度。团队的表现极其出色。虽然也会遇到进展停滞的阶段,但这时需要对团队突破瓶颈的能力有信心。你越是能深入到技术底层进行评估,就越能做出明智的决策。
Waymo 现在的突破是否源于几年前转向端到端深度学习的技术底座切换?此外,如果想走在曲线最前沿,谷歌是否会考虑将更多硬件业务内部化?回看历史,你认为谷歌在资本杠杆上是否过于保守,比如持有过多净现金而非更激进地投入新举措?
Sundar Pichai:我们刚才谈到了机器人。你可以把Waymo 看作是一个机器人。虽然过去三年才起步的团队在某些方面可能进展更快,但 Waymo 是一个极其复杂的集成系统。这有点像台积电或 SpaceX 的发射任务,涉及极其复杂的系统整合。Waymo 内部有很多不为人知的技术积淀,这种工艺和时间的积累非常关键。但我同意,端到端的方法确实是这一过程中的重要加速器。
(关于硬件战略)我们持开放态度。从 Waymo 和 TPU 的经验中,我学到的是,如果想走在曲线最前沿,特别是在涉及安全和监管的领域,必须亲自掌握产品反馈闭环。我认为拥有第一方硬件最终将变得至关重要。
以 Waymo 为例,如果它能更早成熟,我肯定会更早投入资金。我们致力于成为资本的优秀管家。只要我们看好投资资本回报率,就会倾尽全力投入。但当我们认为存在暂时无法有效利用的闲置资金时,我们会寻找其他途径。这就是我们投资 Stripe、SpaceX、Anthropic 等公司的逻辑。我们始终以管家的心态来审视这些决策。随着 AI 浪潮的到来,部署资本的机会显著增多,我们也正在加大力度。这种心态从未改变。如果有更早的投入机会,我非常乐意在 Waymo 还没达到目前的成熟度之前就投入更多。但在那个阶段,出于对安全性的极致追求,有些投入未必是正确选择。也许我们曾做错过决策,但我们的方法是,只要对某个方向产生坚定的信心,就愿意投入资本去完成它。
09
算力预算的精细化管理
过去研发支出主要是人力,但现在TPU 成本已不可忽略。在谷歌内部,你们是否有一个总体的 TPU 预算?在分配资源时,是同时分配人力和算力吗?对于谷歌云,如何处理内部需求与外部客户算力承诺之间的矛盾?
Sundar Pichai:谷歌一直都有算力预算。即便在传统的计算模式下,我们也一直设有算力预算。在机器学习领域,我们广泛使用了TPU 和 GPU。我们在人力规划上非常严谨,但算力规划也是一直以来必须面对的课题。在机器学习算力投入上,我们经历过相对充裕的阶段,也经历过公司整体资源受限的时期。但现在的限制确实非常严重。我每周至少会专门花一小时,以非常细致的程度思考这个问题。我会查看并评估各个项目和团队正在使用的算力单元,掌握这些信息。在当前环境下,我认为这样做至关重要。
(关于云服务的分配)我们会提前规划。谷歌云团队在进行前瞻性规划并制定计划。公司为此提供资金,同时满足内部需求。作为规划的一部分,我们也会与客户签署长期承诺。凡是我们对客户承诺的内容都是不可撼动的,这些是合同义务。通过超前规划可以解决很多问题。尽管目前大家都处于受限的环境中,谷歌云团队可能也会觉得算力不如预期的充裕,但通过提前规划可以妥善应对。
10
AI Agent 化的未来
谷歌云的功能非常庞大复杂,让AI 充当编排层是否是未来的正确方式?此外,用户何时能使用上有状态、具备任务持久性的 AI Agent?另外,为什么谷歌文档的搜索目前比 Gmail 搜索更困难,未来会有改进吗?
Sundar Pichai:AI 作为各类需求的编排层具有极大的潜力。即便在企业内部,作为首席执行官,你并不缺乏数据,难点在于如何将数据整合。过去这往往意味着需要启动一个庞大的类 ERP 项目来连接所有数据源。现在 AI 能够以一种对终端用户有意义的方式充当编排层,看到这种转变令人欣慰。我认为我们还有很大的提升空间,但这确实是一个巨大的机遇。
(关于持久性任务)从方向上看,我们希望赋予用户这种能力,让他们能够以可靠且安全的方式运行持久的长时任务。这需要通盘考虑身份验证和访问权限等问题。我认为这就是未来,是一个 AI Agent 化的未来。将这种能力带给消费者是我们正在关注的一个令人兴奋的前沿领域。我认为未来的消费者界面底层将具备完整的编码模型,并拥有合适的安全框架、技能以及在云端或本地安全运行持久任务的能力。所有这些基础组件正在汇聚。目前世界上可能只有千分之一的人生活在这样的未来中,他们正在为自己构建工具,但将其推向大众市场是一个非常令人兴奋的前沿。
(关于文档搜索的改进)虽然我的感受没有你描述的那么强烈,但这种描述与我的经历很有共鸣。我已经在脑海中梳理要把这段对话放给哪些负责该项目的团队听了,我知道该去找谁。我们确实可以把它做得更好。随着 AI 深度集成到包括谷歌文档在内的这些服务中,未来几个月你会看到显著的改进。最初的版本只是简单地将 AI 嵌入,但随着时间推移,如何保留上下文、如何利用缓存以及如何精准提取信息,我们在这方面可以取得很大进展。
11
工作流的结构性重组
谷歌是否在重新审视工作流、团队构成以及对设计师的能力要求?内部工作流是否有重大转变?
Sundar Pichai:这可以看作是同心圆。谷歌内部有一些小组的转变非常深刻。对我来说,目前的重大任务是如何将这些转变扩散到更多小组,特别是在2026 年。早期由于技术容易崩溃,我们无法全面推行,虽然能看到新世界的曙光,但它还是半成品。但今年我感觉到曲线发生了剧烈变化。
我看到 GDM 以及一些软件工程小组已经彻底改变了工作流程。他们在内部使用一套名为 Jet Ski 的系统,也就是外部所称的 Antigravity。用户生活在其中,处于一个 AI Agent 管理的世界并以这种新方式工作。就在上周,我们把这套系统推向了搜索团队。在大型组织中,变革管理是技术普及的一大难点,而对于小公司来说,切换起来可能很容易。
12
谷歌第一个完全 Agent 化的业务预测
目前企业在使用AI 上仍有差距,面临 Prompt 技巧掌握、代码库共享、数据权限引擎重写以及角色定义模糊等挑战。你认为这种智能的普及会是什么样子?谷歌第一个完全 Agent 化的业务预测会出现在哪个季度?
Sundar Pichai:Gemini 企业团队和 Antigravity 团队都在精准地处理这些问题。你提到的这些正是我们的产品路线图。我们在内部使用中不断遇到这些障碍并设法解决,这正是我们正在交付的产品。普及仍在一个点状发生的过程中。比如谷歌的 SRE 团队突然发现某些环节可以创建自动化工作流。但如何更系统地开展、如何集中化处理技能、如何让模型和全员复用,这些都是关键。身份访问控制是非常困难的问题,也是限制普及的核心障碍,我们必须极其严肃地对待安全性。
(关于自动预测的未来)我预计在某些领域, 2027 年将是重要的拐点。届时这会成为产出预测的核心工作流。或许在一段时间内仍会用传统方式校验,但那个交叉点迟早会到来。我预计 2027 年会是这些转变深刻发生的一年。初创公司拥有一个优势,那就是拥有更多 AI 原生的团队,这可以通过面试等流程实现。而对于我们,则需要经历重新培训和架构转型。这是年轻公司的优势,而我们必须推动这种转型。
谷歌内部目前有什么让你感到兴奋的小项目吗?
Sundar Pichai:这可能会让人感到惊讶。当我们决定研发太空数据中心时,起步团队非常小,只有几个人和很少的预算去完成第一个里程碑。我认为从小处着手很重要,哪怕是一个宏大的构想。
昨天我花时间听取了关于后训练改进的汇报,那是一个人在讲述他们正在做的改进。听完后我觉得这将在产品上展现为一个巨大的飞跃。这种不断发生的微小飞跃正是这个时代的动力所在。我确信有一天我们会公布这些成果。包括太空数据中心和新的机器学习技术。
| 文章来源:数字开物


【AI技术与应用交流群|仅限受邀加入】
AI算力领域TOP级从业者专属圈层
√ 与头部算力企业深度对话
扫码验证身份(需备注姓名/公司/职务
不止有 DeepSeek,更有 AI产业的未来!
【专栏】精品再读
夜雨聆风