这两天看 AI 新闻,有个很明显的变化:
AI 不只是继续陪你聊天了,它开始真的往 Mac 桌面里钻。
更准确地说,是在 2026 年 4 月 15 日到 4 月 16 日这 48 小时里,谷歌、OpenAI、Perplexity 先后把自家的 AI 推到 Mac 的“可操作层”。
一句话先说结论:
这一波最值得看的,不是哪家回答更聪明,而是哪家先把“聊天框”变成了“操作入口”。
这篇我不做伪实测,直接按“云评测”来。也就是基于官方博客、帮助文档和演示信息,带你看 3 个问题:
OpenAI Codex 到底能替你操作什么 谷歌 Gemini 的全局快捷键体验为什么会很关键 AI 开始代替人类点鼠标,真正意味着什么
先看结论:这 3 家根本不是一条路线
如果你只想先知道怎么选,我直接给结论。
OpenAI Codex:最像“会操作电脑的执行代理”
OpenAI 这次最猛的一点,不是桌面上多了个窗口,而是 Codex 开始能在你的电脑上直接操作应用,而且官方明确提到:
它有自己独立的光标,可以一边看你的桌面,一边替你完成操作。
从官方演示口径看,它能处理的事情已经不只是“打开网页搜一下”,而是更接近:
在多个应用之间切换 帮你点按钮、填表单、整理信息 跨窗口完成一串连续动作
这类能力一旦成熟,Codex 就不再只是聊天助手,而更像“能接任务的桌面代理人”。
Google Gemini:最像“系统级随叫随到入口”
谷歌这条线没有一上来强调“替你到处点鼠标”,但它抓住了一个更高频的东西:
全局快捷键。
官方给 Gemini for Mac 的核心体验就是 Option + Space呼出。这个动作很重要,因为它意味着:
你不用切浏览器 不用单独打开网页标签 不用想“我现在该去哪里问它”
它会更像 Spotlight,但里面装的是 Gemini。
如果你日常最常做的是:
快速问问题 总结当前屏幕内容 基于文件、窗口和上下文发问
那 Gemini 这条路会很顺。
Perplexity:最像“带搜索脑子的桌面秘书”
Perplexity 的方向也很明确,它不是只想当问答工具,而是想把 Personal Computer这件事做成一个真正能操作 Mac 的助手。
从官方公开信息看,它的目标是让 AI 在本机上完成一系列实际动作,比如调用桌面应用、帮你处理电脑里的任务。
Perplexity 的优势不在于“最像系统入口”,也不在于“最像编程代理”,而是:
它天生把搜索、答案组织和行动执行绑在一起。
如果你平时工作流本来就很依赖 Perplexity,这套桌面化能力会比单纯网页问答更顺手。
云评测一:OpenAI Codex 到底能替你操作什么?
这部分是这轮新闻里最炸的点。
OpenAI 官方已经把方向说得很直白:Codex 不只是生成文本,它开始可以在桌面上“看”和“做”。
目前更稳妥的理解是,Codex 适合做这几类事:
1. 重复性很强的桌面流程
比如:
打开几个固定应用 在不同窗口里复制整理信息 帮你完成一套流程化点击
只要任务规则足够清楚,Codex 的价值就不是“回答你下一步该干嘛”,而是直接替你干掉一部分机械操作。
2. 跨软件串联任务
这才是桌面 AI 真正有杀伤力的地方。
过去大模型多数只能停留在单窗口里。
现在如果 Codex 能在浏览器、文档、表格、IM、设计工具之间切换,那它处理的就不是单点问题,而是一整段工作流。
3. 软件不会用时的代操作
这点对普通用户很关键。
很多人不是不会写 prompt,而是不会用复杂软件。
如果 Codex 真的能理解当前界面,再替你点到对应位置,那门槛会一下子低很多。
但边界也要说清楚:
现阶段最适合交给它的,还是低风险、可回退、规则清晰的操作。
像付款、删库、发正式邮件、提交关键权限设置,这种高风险动作,短期内都不适合彻底放手。
云评测二:谷歌 Gemini 的全局快捷键,为什么看起来普通却很重要?
很多人一看到 Option + Space会觉得,这不就是又一个快捷键吗?
还真不是。
AI 过去最大的问题之一,是“入口不够短”。
你每次想用它,都得:
打开浏览器 找到标签页 粘贴内容 再问问题
这个动作一长,AI 再聪明也会被用废。
而 Gemini for Mac 的关键价值,就是把这个动作缩到一步:
按键,呼出,说需求。
如果它还能稳定拿到当前窗口、文件或屏幕上下文,那你用它的频率会明显上去。
所以 Gemini 这次不一定是“最会帮你点鼠标”的那个,但很可能是最先变成高频习惯的那个。
这跟它是不是最强模型,其实不是一回事。
入口够短,反而更容易养成日用习惯。
云评测三:Perplexity 为什么也要冲 Mac 桌面?
Perplexity 过去最强的标签,一直是“搜得快、答案清楚、引用强”。
但它只停留在网页里,其实天花板很明显。
因为你查完资料以后,下一步通常还要回到电脑里做事:
发消息 整笔记 开文件 排任务
所以 Perplexity 做桌面助手,本质上是在补最后一公里:
从“告诉你答案”,变成“顺手帮你把电脑上的动作也做了”。
如果这条路走通,它会很适合知识工作者,尤其是那种每天都在“查资料-整理-执行”之间反复横跳的人。
三家放一起看,谁更适合你?
我给你一个最直接的版本。
你想要“它直接替我操作电脑”
优先看 OpenAI Codex。
因为它现在最像真正往 GUI 操作层走的产品。
独立光标这个点,说明它的目标已经不是“在旁边建议”,而是“真正下场执行”。
你想要“我随时叫一下就能用”
优先看 Google Gemini for Mac。
因为全局快捷键这件事,会直接决定你用不用得起来。
很多产品不是不强,是入口太远。
你想要“边搜边做,答案和操作连在一起”
优先看 Perplexity Personal Computer。
它更适合资料检索密集、信息整理密集的工作流。
AI代替人类点鼠标,真正意味着什么?
我觉得这件事比“桌面版来了”大得多。
因为过去 AI 的位置,大多是:
你问,它答 你复制,它总结 你决定,它辅助
但现在开始变成:
你下目标 它拆步骤 它自己执行一部分界面操作
这就是从 chat走向 action。
这会带来 3 个很现实的变化。
1. AI 价值开始从“会说”变成“能做”
以后一个 AI 工具值不值得付费,不只是看回答质量,还要看它能不能真正帮你省掉操作时间。
2. 软件入口会被重新定义
如果 AI 能跨 App 调度,很多软件的核心竞争力就不只是 UI 做得多漂亮,而是:
它愿不愿意被 AI 调用,能不能被 AI 稳定操作。
3. 权限和安全会立刻变成核心问题
AI 一旦开始动你的电脑,风险就不再是“回答错了”,而是“操作错了”。
所以接下来桌面 AI 真正拼的,不只是模型能力,还包括:
权限控制 操作确认 可回退机制 审计记录
谁把这些细节做好,谁才更可能真的留在桌面上。
最后一句
这波 Mac 桌面 AI 的竞争,最值得看的不是谁又发了个新 App,而是一个更大的方向已经很清楚了:
AI 正在从聊天工具,变成电脑操作层。
OpenAI 往“代你执行”走,谷歌往“系统级入口”走,Perplexity 往“搜索+执行一体化”走。
它们看起来都在做桌面助手,但真正抢的,其实是你电脑上最值钱的东西:
下一次点击权。
参考来源
OpenAI:Codex can now operate your computer alongside you https://openai.com/index/codex-for-almost-everything/ Google Blog:The Gemini app is now on Mac https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/ Perplexity:Introducing Perplexity Personal Computer https://www.perplexity.ai/blog/introducing-perplexity-personal-computer OpenAI Help Center:Using Codex on desktop https://help.openai.com/en/articles/11899719-using-codex-on-chatgpt-desktop
本文内容来自网络,个人观点,仅供参考。
夜雨聆风