一、一场没有"新东西"的发布会
说实话,我看完今年Google I/O之后,脑子里蹦出来的第一个念头是:
"这不都是去年画过的饼吗?"
但第二秒我就意识到不对劲了。
因为那些"饼",今年全端上来了。
你没听错。Google I/O 2026的主题不是"我们又发布了什么新概念",而是"我们去年说的那些,现在全都做好了"。这可能是科技行业最罕见的姿势——不是向前展望,而是回头看自己有没有兑现承诺。
Sundar Pichai在开场就扔了一组数据:去年Google的处理量是每月9.7万亿tokens。今年呢?3.2千万亿。翻了330倍。
你可能想问,这数字跟我有什么关系?
关系大了。因为这些tokens不是Google自己在那跑着玩的,而是13个月活破10亿的产品在同时消耗——其中5个产品的月活超过30亿。Gemini app从去年的4亿月活直接翻到了9亿,AI Overview覆盖25亿用户,AI Mode搜索月活也悄悄破了10亿。
讲真,这不是PPT数据。这是全世界人每天在用AI的真实痕迹。
二、Gemini 3.5:快到你来不及眨眼的模型
这次发布的Gemini 3.5 Flash,Google给了一个很嚣张的定位:比其他前沿模型快4倍。
4倍是什么概念?你在ChatGPT里敲一行字等3秒的事情,在这边不到1秒就出完了。现场演示了用3.5 Flash实时生成一个完整的Chrome Dino小游戏——你盯着屏幕右上角的token速度,那个数字跳得比股票还快。
这其实是AI体验的核心痛点。
我们一直在关注"模型有多聪明",但忽略了"模型有多快"。当你在做代码补全的时候,快0.5秒和慢0.5秒完全是两种体验——一个是"AI在帮你",另一个是"你在等AI"。
Gemini 3.5 Flash现在默认驱动着Gemini app和Google搜索的AI Mode。换句话说,你每天在用Google的时候,背后已经在跑这个新的超快模型了,你只是没注意。
但真正让我坐直身子的,不是Flash。
三、Gemini Omni:AI终于学会了"看世界"
如果说之前的AI是"听说读写",那Gemini Omni就是"看、做、理解"。
Google把它叫做"世界模型"——一个不寒碜的称呼。它的核心能力是全模态输入和全模态输出:你可以给它一段文字、一张图、一段音频甚至一个视频,它都能理解,然后生成……什么东西都行。
视频。这是最炸裂的部分。
给Omni一张静态照片,它能生成一段视频。给它一段文字描述,它能生成一段视频。给它一段音乐,它也能生成一段视频。你甚至可以对它说"我想要一个日落的延时摄影,前面加一只猫走过"——然后它就给你做出来了。
这不是在开玩笑。Gemini Omni的演示视频在YouTube上已经超过2200万次播放,评论区全是"我的天"和"这不可能是真的"。但它就是真的。
Google宣布Omni将首先在Gemini app、Google Flow和YouTube Shorts里上线——这意味着很快你用YouTube Shorts拍短视频的时候,背后可能已经有Omni在帮你自动生成效果了。对开发者来说,Omni的API也会逐步开放。
你可能会问,这跟之前那些视频生成工具有什么区别?
区别在于"理解"。Omni不是简单的图生视频——它理解视频里的物理规律、光影变化、物体运动。它知道水应该怎么流、人应该怎么走、光应该怎么反射。这就是"世界模型"的含义:它不是在学习像素,它是在学习这个世界本身。
四、Gemini Spark:你的AI管家,来了
如果说Omni是给你看的,那Gemini Spark就是给你用的。
Spark是一个运行在云端、连接到你的Google账户的个人AI代理。它能读你的Gmail、翻你的Drive、看你的日历——然后在30多个第三方工具里帮你执行任务。
现场有一个很生动的demo:主持人说"我明天有个校友演讲,帮我准备一下"。Spark自动从Drive里拉出了他的简历,从Gmail里找到了学校的确认邮件(连时间地点都提取出来了),然后用Docs Live生成了一个完整的演讲稿大纲。整个过程他说了三句话,Spark做了所有的工作。
更关键的是,Spark不是"你问它才做"。Google说它可以主动做事——比如看到你有一封未回复的重要邮件,提醒你;发现你下周有个会议没准备材料,帮你提前整理。
说白了,Spark是Google对"AI Agent"这个概念的终极实践。不是让你用ChatGPT聊天,而是让AI像一个真正的同事一样,帮你完成具体的事情。
它会在Gmail和Google Chat里率先推出,只对Google AI Ultra用户开放——之后会进入Chrome浏览器,变成一个"代理浏览器"。
五、Android要变了
Android今年的更新,关键词就一个字:"AI原生"。
Google宣布了一个相当激进的方向:AI-native Android开发。你可以在Google AI Studio里直接输入一句话——比如"帮我做一个记账app"——然后它就会生成完整的Kotlin代码、Jetpack Compose UI和推荐架构。
这可能会彻底改变app开发的门槛。以前你需要学Java/Kotlin、学Android Studio、学各种库和框架。现在你只需要知道你想要什么。
Android Studio本身也被深度植入了AI:自动生成测试、智能debug、代码解释、架构推荐——Google称之为"Agentic software engineering"。换句话说,AI不再是你的代码补全助手,AI是你的同事。
Android 17的另一个重点是多设备体验。"Continue On"功能让你在手机上做的事,可以无缝切到平板上、切到电脑上——这个体验听起来很像苹果的Handoff,但Google是在整个Android生态里做,覆盖的是全球数十亿设备。
还有个值得注意的细节:Google这次正式推出了Googlebooks——运行Gemini Intelligence的新笔记本产品线。这意味着Google正式把AI作为PC的核心卖点,跟微软的Copilot+ PC正面竞争。
六、底层也在变
很多人在关注应用层的时候,可能忽略了Google在基础设施上的动作。
这次I/O上,Google宣布了Jackson Pathways技术——可以把训练任务无缝分发到全球超过100万个TPU上。这意味着Google可以组建世界上最大的训练集群,没有任何物理限制。
为啥这很重要?
因为AI的竞争,到后面就是算力的竞争。谁有更多的芯片、更高效的训练方式,谁就能训练出更强的模型。Google在TPU上的投入不是一年两年了,这次宣布"百万TPU集群",本质上是在告诉所有人:"我们的基础设施,已经为下一代AI做好了准备。"
这可能是最容易被忽略、但最有长期价值的发布。
七、写在最后
回到开头那个问题:这场I/O到底发布了什么"新东西"?
答案可能是:Google不需要发布新概念了,因为它终于把"旧概念"做成了真正的产品。
Gemini 3.5 Flash让你几乎感受不到延迟,Gemini Omni能理解和生成视频,Gemini Spark像一个人一样帮你做事,Android从底层到应用全都AI化了——这些东西去年还只是"愿景"和"demo",今年已经实实在在地跑在了数十亿用户的设备上。
我觉得这恰恰是AI行业进入新阶段的信号。
前两年大家都在比"谁的想法更超前",现在比的已经是"谁能把想法变成人人都能用的产品"。Google的答案是全栈——从芯片到模型到产品到生态,每一层都自己做。
这条路走得对不对,我不知道。但看到Gemini app一年翻了一倍多的用户,看到33倍的token增长,看到Omni那个2200万播放的视频评论区一片哀嚎"我的工作还能保住吗"——
我突然觉得,也许我们低估了"把饼端上桌"的力量。
毕竟,说得再好听,不如真正能用。
如果觉得这篇文章对你有帮助,欢迎点赞、推荐、转发给你的朋友。也别忘了关注xxDays,我们会持续追踪AI和科技的最前沿,用大白话讲清楚那些让你好奇的事。
夜雨聆风