Google I/O 2026 把一组原本分散的信号集中到了同一张桌面上。 Xreal 首次完整展示 Project Aura ,这是一副搭载 Android XR 的有线 XR 眼镜,现场演示了沉浸式地图、 YouTube 180/360 、 WebXR 三维绘画,以及把 Gemini 的多模态能力延伸到电脑侧的场景; Google 同时公布了音频眼镜与显示眼镜两条路线,前者计划在今年秋季更早落地,后者继续强化抬头可见的信息提示; Android XR Developer Catalyst Program 也同步开放,向开发者提供开发机、技术资源和资助申请入口。把这些动作放在一起看,重点不在某一副眼镜能卖多少台,核心在于 Google 正尝试把“谁先接住用户意图”这件事,从手机屏幕重新分配到更靠前的感知层。它押注的是一套新顺序:先理解场景,再调度服务,手机退到后端完成执行。更准确地说,手机开始从第一入口退到执行底座。音频眼镜、显示眼镜、 Aura 以及开发者计划之所以需要一起看,是因为它们分别对应全天候陪伴、抬头可见信息、沉浸式能力和生态供给,四块拼图合起来,才接近一个真正可持续的入口系统。

一、 Google 正在推进的,不是一台新设备,而是一套入口分层
手机时代的主路径很稳定:掏出设备,解锁,进入 App ,再执行任务。眼镜路径更靠前。它先知道你站在哪里、看向哪里、准备做什么,然后才决定是否调用地图、翻译、消息、外卖或搜索。顺序一变,真正先拿到用户“第一跳”的,不再只是桌面上的图标,而是最先理解场景的那个系统层。
Project Aura 的意义也在这里。它不是孤立的硬件发布,而是 Google 把 Android XR 、 Gemini 、地图、开发者计划和合作伙伴一起打包,做成一套连续的入口实验。音频眼镜负责全天候、低摩擦的语音协助;显示眼镜补足信息提示; Aura 这类更重的 XR 设备承担沉浸式与多窗口场景。三条路线并行,反映的不是产品犹豫,而是平台方在做分层布局。
从平台视角看,这类分层很关键。手机短期内仍是支付、认证、重度编辑和复杂浏览的核心终端,但“抬头先获取信息、开口先发起任务、看见再决定下一步”的那部分行为,已经出现新的承接者。谁先掌握这一层,谁就更有机会决定后面调起哪些服务、哪些应用、哪些交易链路。对平台公司而言,这相当于把入口争夺从“桌面分发”推进到“场景分发”,商业价值会更前置,用户数据也会更连续,应用分发秩序也会随之变化。

二、 2026 之所以重要,在于行业终于从演示阶段走向了生态起跑线
过去几年,智能眼镜更像高成本试验品:概念清楚,日常价值不够稳定,佩戴负担又偏高。市场确实在升温。可别把升温误读成熟。成熟了吗?没有。公开市场数据虽然口径不完全一致,但相对保守的估计也指向同一件事: 2025 年全球 AI 眼镜出货已经达到 870 万台量级, Meta 一家占去约 740 万台,说明这类产品不再只是极客玩具,而是开始形成真实消费需求。
更值得重视的是行业结构的变化。中国市场在 2025 年已接近百万台规模,增长速度明显快于多数区域市场;多家研究机构还把 2026 年全球 AI 眼镜出货看到了 1500 万台以上。该预测区间较宽,需谨慎看待,但方向并不含糊:更多手机厂商、互联网平台与供应链企业正在进入,竞争焦点也从“有没有产品”转向“谁能把生态做成默认配置”。更准确地说,真正稀缺的已经不是做出一副眼镜,而是把内容、服务、支付和开发者一起接上去。
Google 此时把 Developer Catalyst Program 公开出来,信号比单次发布更强。它不仅给 Project Aura 配套开发机,也把音频眼镜、显示眼镜一起纳入支持范围,还附带资源和资助机制。这意味着 Android XR 不再满足于做一套未来概念,而是开始提前锁定内容、工具链和开发者心智。开发者若能在未来 6 到 12 个月内完成适配, Google 就有机会在消费市场真正起量前,把关键体验预先摆到货架上。对平台竞争来说,这一步通常比首批销量更重要。
三、眼镜先切走的,不会是重任务,而是那批高频短链路动作
当前最具确定性的场景,并不是“眼镜彻底替代手机”,而是轻决策和短链路交互。翻译就是典型案例。显示眼镜可以把外语内容直接叠在视野里,耳边同步给出语音结果,用户不用再反复切换手机与现实环境。导航也类似。说出“带我去最近的咖啡店”之后,前方出现转向提示,低头再看小地图,这种体验节省的不是几秒钟,而是一次次打断行动的成本。
消息摘要、拍照、看店铺评价、添加日历、通过语音完成下单前准备,同样属于这类短链路任务。它们的共同点是步骤不长,却极高频,而且都发生在现实场景里。只要眼镜能把这批动作稳定接住,很多 App 的位置就会下沉,从直接入口退到被系统调度的能力层。
这也是 Google 此次布局最值得写的地方。它押注的不是“第二部手机”,而是“先于手机发生的那一秒”。用户在路口、机场、商场、展馆、陌生街区做的第一件事,往往不是深度操作,而是确认方向、理解环境、补一条信息、发起一句请求。入口价值,就藏在这些看似细小的起点里。只要系统能稳定理解视线、位置、语音和周围环境,很多原本需要用户自己决定“先开哪个 App”的时刻,就会被平台自动改写成“先问系统,再由系统分发”。这对用户很顺手,对应用层却未必轻松。

四、手机不会很快退场,因为眼镜离全天候默认设备还有明显距离
热度升高不等于约束消失。问题也不抽象。续航、价格、隐私,样样都硬。
还差一口气。
能用吗?能。能不能无感替代手机?还远。便宜吗?也谈不上。公开体验普遍提到,这类产品在混合使用场景下大多只能支撑数小时,一旦频繁开启相机、录制视频或持续调用 AI ,掉电速度会进一步加快,通勤场景里尤其容易让人发慌。价格也是现实阻力。即便是更成熟的 AI 眼镜,主流售价也已进入数百美元区间;显示能力更强、还依赖外接计算单元的产品,成本只会更高。电量焦虑、价格压力、隐私担忧和佩戴不适一旦叠在一起,用户很容易从新鲜转成失望,甚至反感。买了却吃灰,这是消费电子最难看的结局之一。
隐私与佩戴体感则构成第二道门槛。手机拍摄至少有明显动作,眼镜拍摄更难被周围人感知;镜框审美、长时间压耳、近视适配、强光下可视性,也都会影响日常留存。现有数据尚不足以支持确定性结论,但有一点很清楚:如果这些摩擦没有被压到足够低,眼镜就很难真正进入全天佩戴状态。
Project Aura 自身也提示了行业所处阶段。它通过口袋计算单元换取更轻的头部负担和更强的算力,这是一种务实方案,却也说明“像普通眼镜一样无感佩戴”的终局还没有到来。音频眼镜看上去更接近日常穿戴,显示眼镜则更容易带来信息过载和功耗压力,不同形态之间的取舍还远未收敛。更准确地说,这类设备并非不能用,而是还没有好用到足以替代日常习惯。换言之,手机不会被立刻替代,更多可能是权限被重新划分:重任务仍留在手机,前置感知和即时协助开始被眼镜分走。

五、真正需要盯住的,是默认入口开始从单点变成多层
回到 Google 与 Xreal 这次合作,值得关注的不是某一副眼镜的参数领先,而是默认入口的结构已经开始变化。手机仍然负责交易闭环和深度操作,眼镜则尝试拿下第一感知、第一提醒、第一次问答和第一次任务分发。入口不再只有一个中心屏幕,而是在向更贴近现实世界的界面扩展。
如果 Google 把这层接口做顺,后续商业逻辑会跟着变化。以前最值钱的是把图标放到用户首页,后来变成把服务装进超级 App ,下一步更可能是谁能在用户刚看见、刚转身、刚开口的时候先出现。那一层看上去离交易更远,实际更靠近意图生成的源头,平台议价能力反而会更强。广告分发、地图导流、本地生活、支付前置链路,都会被重新排序。手机未必会退场,默认入口已经开始松动。对平台公司来说,这比发布一副新眼镜更重要。
夜雨聆风