Google今天上线了Gemini的Mac App。GPT和Claude都有了之后,可能Google也耐不住寂寞,准备跟上。

但说老实话,目前体验还是非常简陋。和Claude自然不能比,和GPT比也是差远了,但不是没有亮点。
首先,基本界面的功能只有聊天,有热键呼出(Option+Space)。

最该差评的是没有Gem,你自定义的智能体不能用。
不过有个亮点,就是点+号,除了生图等网页版都有的功能以外,还会有一个share window。

点击后会要求授权(截屏等权限),授权后可以把当前App的界面自动截屏,当作上下文开始聊天。

虽然Atlas和Claude插件也有类似功能,或者类似的实现方法,但是这里默认走视觉识别。Atlas浏览器其实是抓取文字信息,Google走视觉识别还是有点意思的,Gemini的视觉识别效果也不错。
相比文字抓取,它的好处是:不局限于浏览器内容,Outlook、其他应用也都可以,能截图就能聊,一键添加。你可以问网页内容,也可以问一些其他需要通过视觉确认的问题,比如UI、设计、图片风格,不必经过复杂的App连接。
但也有局限性,就是截屏内容就是全部。比如X和网页,你必须下滑才能看到下面的内容;截图只能所见即所得,不能把图片以外的内容一起给你。
不过毕竟是第一版,还是可以期待一下。Gemini其实最大的问题是3.1这个模型有点落后,而且推理预算也被削减得厉害,这点解决的话未必不能打。

夜雨聆风