乐于分享
好东西不私藏

Google COSMO泄露:安卓手机正在变成AI Agent

Google COSMO泄露:安卓手机正在变成AI Agent

一个 App 悄悄上架 Google Play,1.13 GB,名字叫 COSMO。描述只有一句话——”一款 Android 设备上的实验性 AI 助手应用”。

然后,不到 24 小时,Google 把它撤了。

像是手滑发了一条不该发的朋友圈,又赶紧删掉。但互联网有记忆,手快的人已经截了图、拆了包、扒出了里面所有的代码和功能清单。

看完之后,我的第一反应是:这不是一个 App,这是 Google 在 Android 上搭的 AI Agent 底座。

它不只是助手,它能”看”你的屏幕

图片来源@minchoi

COSMO 来自 Google Research,包名是 com.google.research.air.cosmo,走的是 Google 官方账号发布的。

跟 Gemini 最大的区别在哪?COSMO 直接调用了 Android 的 AccessibilityService API——也就是”无障碍服务”。

这个权限意味着什么?它能读取你屏幕上显示的所有内容。你在看什么 App、在跟谁聊天、在填什么表单,它全知道。

666,这不是语音助手,这是”屏幕级感知”。

更狠的是,COSMO 内置了一个叫 Gemini Nano 的本地模型,不联网也能跑。它有三种运行模式:

混合模式:有网用云端”PI”模型,没网切本地 Nano
纯云端:只用服务器端 PI
纯本地:只用设备上的 Nano

这意味着你的手机正在长出一个”离线大脑”。不需要等服务器响应,不需要担心断网——AI 就住在你的手机里。

14 个”技能”曝光了 Google 的真实意图

COSMO 列出了 14 个功能,Google 自己管它们叫”Skills”。逐一看完,你会发现这不是一个聊天机器人,而是一个什么都能干的数字管家

能听——它支持 Voice Match(声纹识别),能认出是你在说话。

能看——通过无障碍服务读取屏幕内容,你说”帮我找一下上周那张照片”,它直接翻。

能记——有个叫 Recall 的功能,可以”找回你试图回忆的东西”。你跟它聊过什么、看过什么,它帮你存着。

能搜——Deep Research 功能,遇到复杂问题,它会像研究员一样多源检索,给你出一份完整报告。

能干活——Browser Agent 直接调用 Google Mariner(浏览器自动化),帮你在网上完成任务。日历提醒、定时器、文档撰写,一句话搞定。

能总结——你跟别人聊完一段话,切换场景时它自动帮你总结刚才聊了什么。

说实话,看到这里我是有点震惊的。这些功能拆开来看,每一个都有产品在做——Perplexity 在做搜索、Anthropic 的 Computer Use 在做屏幕操控、Apple 的屏幕感知也在慢慢推进。

但 Google 直接把这 14 个能力打包到了一个 App 里,塞进了 Android 系统层

你猜这 14 个能力组合在一起,最接近的产品是什么?不是 Siri,不是小爱同学,而是科幻电影里那个你喊一声就帮你搞定一切的”贾维斯”。

从”你问我答”到”我替你做”

这才是 COSMO 真正可怕的地方。

我们习惯的 AI 助手是”你问我答”模式——你发一条消息,它回一条消息。Siri 是这样,小爱同学是这样,早期的 Gemini 也是这样。

COSMO 不一样。它的设计逻辑是:AI 主动感知环境,主动判断你需要什么,主动替你执行。

举个例子:你在跟朋友微信聊天,提到”下周三下午两点开会”。传统助手需要你手动说”帮我创建一个日历事件”。COSMO 的 Calendar Event Suggester 会直接弹出来说:”检测到一个会议安排,要帮你加到日历吗?”

再比如:你在浏览器里看到一篇很长的英文论文,正准备翻译。COSMO 的 Deep Research 功能可能已经识别出你在看什么,主动问你:”要不要我帮你做一份中文摘要?”

这不是助手,这是 Agent

Agent 和助手的区别,就像秘书和管家的区别。秘书等你吩咐,管家提前把事情安排好。

Google IO 倒计时:这绝不是巧合

COSMO 上架的时间是 4 月底,被撤是 5 月 1 日。Google IO 2026 的时间呢?5 月 19 日。

你品,你细品。

Google 每年 IO 大会前都有”手滑”的传统。去年 Android XR 眼镜的概念视频也是提前泄露的。COSMO 这次上架又撤回,大概率是有人把内测包推到了公开频道。

但泄露的内容本身不会骗人。从 Google 已经公布的 IO 2026 议程来看,有一个专场叫 “What’s new in Android”,描述里明确提到了”agentic automation”——用 AI 智能体自动化来帮用户完成更多事情。

COSMO 就是这个”agentic automation”的具体落地。

再加上 Google 同时在推的 Aluminum OS(合并 Android 和 ChromeOS)、Android XR 智能眼镜,一张蓝图正在浮出水面:Google 想让 Android 不只是手机操作系统,而是一个 AI Agent 运行平台。

对创作者意味着什么

如果你是内容创作者、自媒体人、自由职业者,这件事跟你有什么关系?

第一,AI 工具的交互方式要变了。 现在你用 ChatGPT、Claude,还得自己复制粘贴上下文。未来的 AI Agent 能直接”看到”你在做什么,主动提供帮助。你的写作流程、素材收集、排版发布,可能都会被 AI 串联起来。

第二,”本地 AI”时代加速到来。 COSMO 内置 Gemini Nano,不联网就能跑。这意味着创作者在飞机上、地铁里、信号差的地方,也能用 AI 辅助工作。1.13 GB 的体积虽然不小,但换来的是一整个离线智能助手。

第三,Google 正在抢 Agent 入口。 跟 OpenAI、Anthropic 比,Google 有一个别人没有的优势——它控制着 Android。当 AI Agent 直接嵌入操作系统层,第三方 App 的生存空间会被压缩。对创作者来说,这意味着你需要关注平台生态的变化,别等被淘汰了才反应过来。

666,说白了就是:你的手机正在从”你用的工具”变成”帮你干活的队友”。

现在就该想清楚的事

COSMO 现在已经从 Play Store 消失了。但就像那些被删掉的朋友圈一样,截图早已传遍全网。

5 月 19 日的 Google IO,大概率会正式发布 COSMO 或者类似的产品。到时候,Android 用户将第一次体验到”手机变 Agent”是什么感觉。

我的建议是:现在就开始关注 AI Agent 这个方向。 不是让你立刻去开发,而是想清楚——当你的手机真的能”看、听、记、搜、做”的时候,你的工作方式需要怎么变?

那些提前想明白的人,会在这一波浪潮里吃到最大的红利。

Huintellimance

让未来智能早日来临

促进人类与未来智能沟通交流平台

全网|Huintellimance

 加入交流群·