Google 把 AI 塞进了整个操作系统,Gemini Intelligence 正式发布
5月12日的 Android Show 上,Google 做了一件意味深长的事——把 Gemini 从"聊天助手"升级成了操作系统级能力,起了个新名字叫 Gemini Intelligence。
几个值得关注的点:
- 多步骤任务自动化:Gemini 现在能跨应用执行复杂操作。比如拍张冰箱的照片,让它直接在超市 App 里下单买菜。不用装特定应用,走 Chrome 就能完成。
- Chrome Auto Browse:6月底上线,Gemini 可以帮你在浏览器里查资料、比价、甚至预约停车位。这基本就是把 RPA 做进了浏览器。
- 生成式 UI:跟 Gemini 说句话就能生成桌面小部件,不需要开发。
首批支持 Samsung Galaxy 和 Google Pixel,今年夏天推送。后续扩展到手表、车载、眼镜和笔记本。
与此同时,Google 还公布了一个全新设备品类——Googlebooks。不是 Chromebook 的替代品,而是以 Gemini Intelligence 为核心的 AI 笔记本。Acer、Asus、Dell、HP、Lenovo 都在首批合作名单里,预计秋季上市。
为什么值得关注:Google 在做一件和 Apple 不同的事。Apple 把 AI 功能做进了现有产品,Google 则在用 AI 重新定义整个设备品类。如果 Googlebooks 真的把 Gemini 做成底层能力而不是套壳应用,那对开发者工作流的影响会是实质性的——想象一下,打开笔记本就能直接跟 AI 协作写代码、调试、部署,不需要切换工具。
AI 编程代理 2026 横评:终端派和 IDE 派,两条路已经分叉了
ofox.ai 5月12日发布了一份 AI 编程代理横评,对比了 Claude Code 2.1.138、Codex CLI、Cursor 和 DeepSeek TUI 四款工具。
一个清晰的分化出现了:
终端派(Claude Code、Codex CLI、DeepSeek TUI)——走命令行路线,强调和 Git 工作流深度集成,适合 DevOps 场景和服务器端操作。你可以把它理解成"AI pair programmer in your terminal"。
IDE 派(Cursor 为代表)——走图形界面路线,注重实时代码补全和上下文感知,写代码的时候像有个助手坐在旁边随时递话。
为什么值得关注:这个分化不是"谁更好"的问题,而是反映了开发场景的本质差异。终端派更像是自治型 agent——你给一个任务,它自己跑完;IDE 派更像是增强型 copilot——你写代码,它配合你。选哪条路,取决于你的工作方式。
智元机器人下线 1 万台,远征 A3 发布
首届香港具身智能产业峰会上,智元机器人创始人邓泰华透露:截至3月底,智元已累计下线 1 万台机器人,2026年目标是数万台量产。
联合创始人彭志辉(稚晖君)同时发布了远征 A3——一台 55 公斤的全尺寸人形机器人,瞬时爆发功率 12 千瓦,能打拳、能空翻,定位文娱商业场景。
为什么值得关注:1 万台这个数字比任何参数都重要。具身智能圈子里,大家讨论了很多年的问题一直是"什么时候能量产"。智元给出了一个实际答案。远征 A3 的定位也很有意思——不是工厂、不是仓库,而是文娱和商业展示场景。先用高动态表演能力创造收入,再用数据迭代实际作业能力,这是一条务实的路。
网易 CodeWave:企业 AI Coding 的另一种答案
网易智企发布了 CodeWave 企业 AI Coding 平台,核心卖点是"可控"。
技术底座是 NASL(NetEase Application Specification Language),通过 Spec 驱动 AI 生成代码,加上可视化开发工具,实现从需求到上线的全链路管控。
为什么值得关注:国内企业对 AI 写代码的顾虑,和海外不太一样。海外开发者更关心"AI 能不能帮我写得更快",国内企业更关心"AI 写的代码能不能审计、出问题能不能追溯"。CodeWave 的"可控"取向,踩中的是一个真实痛点。它和 Cursor、Claude Code 的定位完全不同——后者是给开发者个人用的效率工具,CodeWave 是给企业 IT 部门用的管控平台。
夜雨聆风