俗话说:做AI的路子,都绕不开“做个好用的桌面助手”和“能真正操作电脑”这两层,只是大家出发的早晚不同而已,走得快的则已经上手,走得慢的则还在敲门。
没有哪个搞AI的巨头会忽视电脑这块屏幕,这是兵家必争之地,就像打仗谁也不会忽略指挥部突然多了一个超级参谋,搞AI的也一样。任何一个AI助手最终都会常驻桌面并能替你干活,关键就看谁更早把这“三板斧”抡圆了。
谷歌这次是不是在放大招,目前还不能完全断定,但任何AI往你桌面上挤才是硬道理。其实从咱们普通用户的角度来说,Gemini Mac版真的是一个挺够意思的助手。如果你用上了它,这个小白框可能会帮你省去很多麻烦,从写邮件到总结网页,一键搞定。从谷歌自己的角度来说,这则是一个关键的落子,也是一个明确的信号。

然而从今年四月发布以来,谷歌正在以肉眼可见的速度给Gemini“上装备”,朝着更智能、更主动,从“旁观建议”走向“动手执行”的路径狂奔。
1. 入口愈来愈顺手
如果从“用起来方不方便”这方面来看的话,谷歌无疑是在下狠功夫。以前的AI助手几乎每一次调用都得经历“打开浏览器-登录-复制粘贴”的繁琐流程,从Chrome到Safari再到Edge,每一件麻烦事都消耗着用户对该工具的热情。但是现在的Gemini for Mac却没有以前那帮“网页套壳”助手的架子。比如的更新,虽然它很原生很流畅,但仍然是对“低摩擦”这个核心的贯彻而已。

在“Option+空格”的全局快捷键下,AI赖以生存的“随时待命”属性已经落到实处,也就容易理解为什么谷歌的博客里满是自豪。这是一个水到渠成的过程,入口顺了,用户才爱用。自打谷歌用不到100天、写出了100多个原生Swift功能,这客户端不仅承载了谷歌的野心,也将对标于最新的ChatGPT for Mac。以及来势汹汹的Claude,都盯着每一块电脑屏幕。
2. “看懂屏幕”与“动手干活”
谷歌通过“窗口共享”这个功能,实现了关键的“视觉理解”;盯着你的图表、读着你的文档、总结着你的视频。我们不深究这功能是否是最优的技术方案,但是“能看见”一定是第一步。可笑的是AI终于不再“装瞎”,可以理直气壮地分析自己“看到”的内容了,这进步实实在在。
3. 真正的考验

在免费好用的趋势下,也许谷歌抢了先,但是真正的较量才刚刚开始。当聪明的AI不得不从“看懂一个窗口”进化到“操作Excel”、“整理Finder文件”等具体动作,对比突然显得强大的“视觉能力”与依然“瘫痪的双手”,谷歌的短板可能就露出来了,比如现在还做不到的跨App连贯操作、自动整理桌面。
更进一步,当AI走向“电脑管家”的时候,和当年杀毒软件一样会接管并调度你的文件与应用,这才是AI该有的样子吧!
4. 谷歌的野望

未来几年,谷歌将不得不面对类似苹果一样的生态挑战,我一直觉得系统级的集成才是AI助手的终极形态,谷歌的客户端,包括被迫强调的“仅支持M芯片Mac”,谷歌所面对的软硬结合难题才刚刚开始,走错一步,很容易导致优势沦为孤岛。
如果从竞争角度去看的话,谷歌现在仍然是追赶者,目前ChatGPT的“电脑操作”能力已达到令人惊讶的深度,而且还在快速迭代,也只有Claude才能与之争夺“最聪明桌面助手”的称号,从早期的网页聊天到现在的原生客户端,谷歌能保证在下一轮不掉队吗?
谷歌靠“免费”和“快”打开局面的阶段过去了,也就是从“有没有”的层面下来了。而且现在的用户已经趋于理性,不只是谷歌,其他AI助手也只能在“响应速度”、“界面美观”方面比拼,并没有实际上的代差。这不能说现在的谷歌产品太弱,只能说对手的底子太厚了。

所以若说桌面是必争之地,但是并不是只有谷歌在走的阳关道,也不是说就这么盖棺定论了。更多的只是吹响了号角而已。
谷歌Gemini for Mac所带来的热度似乎是他一个人的“技术秀”。然而从长期从业者的角度来说,这一切并非是一夜之间冒出来的,而是有相当长的一个技术铺垫过程。
所以说谷歌会慢慢赢吗?有可能,毕竟这种事谁也说不准,但是就现在的情况看,它离“全能桌面副驾驶”还有一段距离。
对我们普通用户来说,这只是AI浪潮中的一个实惠选择,好好利用当下AI能提供的“省时省力”的工具和灵感,就足够了。
夜雨聆风