Google的AI帝国,终于拼上了最后一块拼图

一、一场没有"新东西"的发布会

说实话，我看完今年Google I/O之后，脑子里蹦出来的第一个念头是：

"这不都是去年画过的饼吗？"

但第二秒我就意识到不对劲了。

因为那些"饼"，今年全端上来了。

你没听错。Google I/O 2026的主题不是"我们又发布了什么新概念"，而是"我们去年说的那些，现在全都做好了"。这可能是科技行业最罕见的姿势——不是向前展望，而是回头看自己有没有兑现承诺。

Sundar Pichai在开场就扔了一组数据：去年Google的处理量是每月9.7万亿tokens。今年呢？3.2千万亿。翻了330倍。

你可能想问，这数字跟我有什么关系？

关系大了。因为这些tokens不是Google自己在那跑着玩的，而是13个月活破10亿的产品在同时消耗——其中5个产品的月活超过30亿。Gemini app从去年的4亿月活直接翻到了9亿，AI Overview覆盖25亿用户，AI Mode搜索月活也悄悄破了10亿。

讲真，这不是PPT数据。这是全世界人每天在用AI的真实痕迹。

二、Gemini 3.5：快到你来不及眨眼的模型

这次发布的Gemini 3.5 Flash，Google给了一个很嚣张的定位：比其他前沿模型快4倍。

4倍是什么概念？你在ChatGPT里敲一行字等3秒的事情，在这边不到1秒就出完了。现场演示了用3.5 Flash实时生成一个完整的Chrome Dino小游戏——你盯着屏幕右上角的token速度，那个数字跳得比股票还快。

这其实是AI体验的核心痛点。

我们一直在关注"模型有多聪明"，但忽略了"模型有多快"。当你在做代码补全的时候，快0.5秒和慢0.5秒完全是两种体验——一个是"AI在帮你"，另一个是"你在等AI"。

Gemini 3.5 Flash现在默认驱动着Gemini app和Google搜索的AI Mode。换句话说，你每天在用Google的时候，背后已经在跑这个新的超快模型了，你只是没注意。

但真正让我坐直身子的，不是Flash。

三、Gemini Omni：AI终于学会了"看世界"

如果说之前的AI是"听说读写"，那Gemini Omni就是"看、做、理解"。

Google把它叫做"世界模型"——一个不寒碜的称呼。它的核心能力是全模态输入和全模态输出：你可以给它一段文字、一张图、一段音频甚至一个视频，它都能理解，然后生成……什么东西都行。

视频。这是最炸裂的部分。

给Omni一张静态照片，它能生成一段视频。给它一段文字描述，它能生成一段视频。给它一段音乐，它也能生成一段视频。你甚至可以对它说"我想要一个日落的延时摄影，前面加一只猫走过"——然后它就给你做出来了。

这不是在开玩笑。Gemini Omni的演示视频在YouTube上已经超过2200万次播放，评论区全是"我的天"和"这不可能是真的"。但它就是真的。

Google宣布Omni将首先在Gemini app、Google Flow和YouTube Shorts里上线——这意味着很快你用YouTube Shorts拍短视频的时候，背后可能已经有Omni在帮你自动生成效果了。对开发者来说，Omni的API也会逐步开放。

你可能会问，这跟之前那些视频生成工具有什么区别？

区别在于"理解"。Omni不是简单的图生视频——它理解视频里的物理规律、光影变化、物体运动。它知道水应该怎么流、人应该怎么走、光应该怎么反射。这就是"世界模型"的含义：它不是在学习像素，它是在学习这个世界本身。

四、Gemini Spark：你的AI管家，来了

如果说Omni是给你看的，那Gemini Spark就是给你用的。

Spark是一个运行在云端、连接到你的Google账户的个人AI代理。它能读你的Gmail、翻你的Drive、看你的日历——然后在30多个第三方工具里帮你执行任务。

现场有一个很生动的demo：主持人说"我明天有个校友演讲，帮我准备一下"。Spark自动从Drive里拉出了他的简历，从Gmail里找到了学校的确认邮件（连时间地点都提取出来了），然后用Docs Live生成了一个完整的演讲稿大纲。整个过程他说了三句话，Spark做了所有的工作。

更关键的是，Spark不是"你问它才做"。Google说它可以主动做事——比如看到你有一封未回复的重要邮件，提醒你；发现你下周有个会议没准备材料，帮你提前整理。

说白了，Spark是Google对"AI Agent"这个概念的终极实践。不是让你用ChatGPT聊天，而是让AI像一个真正的同事一样，帮你完成具体的事情。

它会在Gmail和Google Chat里率先推出，只对Google AI Ultra用户开放——之后会进入Chrome浏览器，变成一个"代理浏览器"。

五、Android要变了

Android今年的更新，关键词就一个字："AI原生"。

Google宣布了一个相当激进的方向：AI-native Android开发。你可以在Google AI Studio里直接输入一句话——比如"帮我做一个记账app"——然后它就会生成完整的Kotlin代码、Jetpack Compose UI和推荐架构。

这可能会彻底改变app开发的门槛。以前你需要学Java/Kotlin、学Android Studio、学各种库和框架。现在你只需要知道你想要什么。

Android Studio本身也被深度植入了AI：自动生成测试、智能debug、代码解释、架构推荐——Google称之为"Agentic software engineering"。换句话说，AI不再是你的代码补全助手，AI是你的同事。

Android 17的另一个重点是多设备体验。"Continue On"功能让你在手机上做的事，可以无缝切到平板上、切到电脑上——这个体验听起来很像苹果的Handoff，但Google是在整个Android生态里做，覆盖的是全球数十亿设备。

还有个值得注意的细节：Google这次正式推出了Googlebooks——运行Gemini Intelligence的新笔记本产品线。这意味着Google正式把AI作为PC的核心卖点，跟微软的Copilot+ PC正面竞争。

六、底层也在变

很多人在关注应用层的时候，可能忽略了Google在基础设施上的动作。

这次I/O上，Google宣布了Jackson Pathways技术——可以把训练任务无缝分发到全球超过100万个TPU上。这意味着Google可以组建世界上最大的训练集群，没有任何物理限制。

为啥这很重要？

因为AI的竞争，到后面就是算力的竞争。谁有更多的芯片、更高效的训练方式，谁就能训练出更强的模型。Google在TPU上的投入不是一年两年了，这次宣布"百万TPU集群"，本质上是在告诉所有人："我们的基础设施，已经为下一代AI做好了准备。"

这可能是最容易被忽略、但最有长期价值的发布。

七、写在最后

回到开头那个问题：这场I/O到底发布了什么"新东西"？

答案可能是：Google不需要发布新概念了，因为它终于把"旧概念"做成了真正的产品。

Gemini 3.5 Flash让你几乎感受不到延迟，Gemini Omni能理解和生成视频，Gemini Spark像一个人一样帮你做事，Android从底层到应用全都AI化了——这些东西去年还只是"愿景"和"demo"，今年已经实实在在地跑在了数十亿用户的设备上。

我觉得这恰恰是AI行业进入新阶段的信号。

前两年大家都在比"谁的想法更超前"，现在比的已经是"谁能把想法变成人人都能用的产品"。Google的答案是全栈——从芯片到模型到产品到生态，每一层都自己做。

这条路走得对不对，我不知道。但看到Gemini app一年翻了一倍多的用户，看到33倍的token增长，看到Omni那个2200万播放的视频评论区一片哀嚎"我的工作还能保住吗"——

我突然觉得，也许我们低估了"把饼端上桌"的力量。

毕竟，说得再好听，不如真正能用。

如果觉得这篇文章对你有帮助，欢迎点赞、推荐、转发给你的朋友。也别忘了关注xxDays，我们会持续追踪AI和科技的最前沿，用大白话讲清楚那些让你好奇的事。