乐于分享
好东西不私藏

以后手机不用装App了?OpenAI演示新系统,全程说话操控,看傻了!

以后手机不用装App了?OpenAI演示新系统,全程说话操控,看傻了!

你有没有想过,有一天手机上不再有一屏一屏的App图标,你只需要对着手机说一句话,它就把事情办了?

这不是科幻片。就在几天前,OpenAI在一场黑客松活动上,真有人把这种手机做出来了。

现场演示的画面是这样的:一部普通手机,屏幕上干干净净,没有任何App图标,只有一个等待指令的蓝色光球。开发者对着手机说”帮我查下周从北京去上海的航班”,屏幕上立刻弹出航班卡片,价格、时间、航司信息一目了然。说”把下午1点半的会议删了”,日历上那条记录瞬间消失。说”帮我发封邮件”,邮件编辑界面自动生成,你说内容它就写。全程没点过任何一个App。

我第一次看到这个演示的时候,说实话,愣了好几秒。

一、这个”无APP手机”到底是什么来头?

事情发生在5月底OpenAI的Voice Hack Night(语音黑客松)活动上。一个叫Isa Usmanov的开发者,用了大约6个小时,借助OpenAI的Codex编程工具,搭出了这个原型系统,名字叫”Agentic OS for a Phone”(手机Agent操作系统)。这个项目最终拿下了黑客松的冠军。

它的核心理念叫”UI即系统”(UI is the System)。什么意思呢?传统的手机是”先有App,再有界面”——你打开微信,微信给你一套界面;你打开美团,美团给你另一套界面。每个App各管各的,你得学每个App怎么操作。而这个新系统的逻辑完全反过来:你先说出你想干什么,系统理解你的意图,然后实时生成一个专门针对这个任务的界面。你想要航班信息,它就生成航班界面;你要发邮件,它就生成邮件界面。用完即走,不需要安装任何App。

技术架构也很有意思:简单界面生成本地搞定,用的是手机上的小模型,速度快不卡顿;复杂推理扔给云端GPT大模型处理。相当于手机里住了一个”小脑”,遇到难搞的事再打电话请教云端那个”大脑”。据[快科技]报道,开发者全程通过语音指令完成了预订机票、删除日历日程、查找新闻、发送邮件和列待办事项等操作。

左边焦虑:满屏App看不过来;右边轻松:说句话啥都搞定

二、Sam Altman的野心:从做AI到做手机

这个黑客松原型不是凭空冒出来的。OpenAI CEO Sam Altman早就多次暗示,公司正在研发手机项目,并且公开说过”现在是认真重新思考操作系统和用户界面设计的合适时机”。

据多家媒体报道,OpenAI已经和联发科(MediaTek)、高通达成芯片合作,由立讯精密负责制造。这款手机的芯片将采用联发科定制版Dimensity 9600,台积电2纳米工艺,还专门配了两个AI协处理器——一个管视觉,一个管语音。更有意思的是,OpenAI在2026年已经从苹果挖走了超过40名高级工程师和设计师,包括前iPhone设计总监Evans Hankey。苹果被挖急了,开始给核心员工发高达40万美元的留任奖金。

量产时间呢?之前传闻是2028年,但现在据供应链分析师郭明錤的推算,可能提前到2027年上半年。不过要注意,这个时间表来自分析师推测,不是OpenAI官方发布的。据[OPC进化论]分析,”原型不等于产品,2027主要来自分析师侧的供应链推演,不是OpenAI官方发布的上市时间表”。

但不管具体时间怎么变,方向已经很清晰了:OpenAI要做的不只是一个AI聊天软件,而是一台从头到尾围绕AI设计的手机。

三、跟现在的语音助手有啥区别?区别大了

你可能会说:我现在对着Siri说”帮我设个闹钟”不也能用吗?跟这个有什么不同?

区别大了。现在的语音助手本质上是”帮你按按钮”——你说”打开微信”,它帮你点开微信;你说”设个闹钟”,它帮你调闹钟界面。它只是在现有App体系里帮你省了点操作步骤,底层逻辑没变。

而OpenAI演示的这套系统,是直接绕过了App这层。不需要打开任何App,不需要学习任何App的操作逻辑,你只需要表达意图,AI就替你完成整个任务。这就像:以前你得自己开车去超市买菜、再开车回家做饭;现在你只需要说”我想吃红烧肉”,从买菜到做饭到端上桌,全都替你搞定了。

举个更具体的例子。你用现在的手机订机票,要经历:打开携程App→搜索航班→筛选时间→选航班→填乘客信息→支付,至少六步。而用这个新系统,你只需要说”帮我订明天上午去上海最便宜的航班”,它就自动帮你查好、选好、弹出确认界面,你点一下确认就完事。

坐在咖啡馆说句话,航班酒店行程全出来了

四、不止OpenAI,三大巨头都在抢”AI Agent手机”

OpenAI不是唯一想颠覆手机交互的公司。实际上,2026年6月这一周,三大巨头同时亮出了自己的AI Agent底牌:

▶ Google Gemini Spark:能自主规划旅行的AI Agent

Google刚推出的Gemini Spark,号称能自主规划旅行等复杂任务。The Verge的评价很耐人寻味:”最令人印象深刻也最令人恐惧的AI体验”。实际测试效果跟官方Demo接近——你说”帮我规划东京5天旅行”,它真的能帮你安排行程、选酒店、订餐厅,不需要你一步步指导。

▶ 微软Microsoft Scout + Project Solara:AI Agent专属操作系统

微软在Build 2026大会上发布了全新AI个人助理Scout,基于OpenClaw构建;还有一个叫Project Solara的项目,专门为AI Agent设计操作系统。同时推出的还有Windows Execution Containers安全沙箱,让AI Agent在Windows上安全运行。微软的思路是:不造新手机,但把现有Windows变成AI Agent的运行平台。

▶ OpenAI Agentic OS:最激进的”零App”方案

OpenAI的方案是三个里面最激进的——直接干掉App生态,用AI替代一切。Google和微软还是”AI帮你用App”,OpenAI是”AI替代App”。思路不同,野心也不同。

这三家走的方向虽然不同,但有一个共同点:手机交互正在从”你找App”变成”App找你”。以前是你学App怎么用,以后是App学你怎么想。

三大AI Agent对比:Google管旅行、微软管办公、OpenAI全靠说话

五、别急着兴奋,现实问题一大堆

说了这么多好的,我也得泼几盆冷水。这玩意儿离真正能用,还有一堆问题没解决:

第一,隐私怎么保证?你对着手机说的每一句话、每一个需求,都要经过AI处理。你的行程、消费习惯、社交关系、工作内容,AI全知道。这些数据存在哪里?谁能看到?如果被黑客攻击怎么办?这可不是小事。据[Xatakamovil]报道,即便是演示中,登录第三方服务仍然需要账号——你终究绕不开把自己的密码交给AI这件事。

第二,中文支持怎么样?OpenAI的服务在国内访问本身就有门槛,语音识别对中文方言的兼容性也是个大问题。普通话可能还行,广东话、四川话、东北话呢?你让一个河南大叔对着手机说”俺想坐高铁去北京”,AI能听懂吗?

第三,没网怎么办?这套系统重度依赖云端大模型,一旦断网,复杂任务就做不了。你坐地铁过隧道的时候、去山里露营的时候,手机直接变砖?这跟我们现在离线还能用App的体验差太远了。

第四,习惯了点击操作的人能适应吗?说实话,很多人不喜欢语音操控。在公共场合对着手机说话很尴尬,开会的时候更不可能。完全取消点击操作,只靠语音,对很多人来说不是进步是退步。

第五,App生态怎么办?现在全球有几千万开发者靠App吃饭,微信、支付宝、美团这些超级App不可能轻易把入口拱手让给AI。就算技术上能做到”零App”,商业上的博弈才是真正的硬仗。

六、对普通人来说,现在该关注什么?

先说结论:短期内你不会用上这种手机,但方向值得盯。

如果你是普通用户,现在不需要做任何准备。这个系统还只是黑客松原型,距离消费者能买到至少还有一两年。你该用微信用微信,该点外卖点外卖,生活照旧。

但有几件事值得留意:

一是语音交互的进步比你想象的快。OpenAI的ChatGPT高级语音模式已经能流畅对话了,国内的豆包、千问也在快速追赶。先习惯用语音跟AI聊天,以后过渡到语音操控手机会更自然。

二是关注AI Agent的发展。不管是Google的Gemini Spark、微软的Scout,还是OpenAI的Agentic OS,核心都是”AI替你做事”而不是”AI回答问题”。这个趋势会越来越明显,2026年下半年会有更多Agent产品落地。

三是如果你是开发者或创业者,现在就要开始思考:当用户不再打开App,而是通过AI Agent调用服务时,你的产品怎么被AI”发现”?这可能是下一个十年的流量入口之争。

四种反应:兴奋、好奇、怀疑、已上手——你是哪一种?

写在最后

OpenAI这场演示,让我想起了2007年乔布斯第一次展示iPhone的场景——当时所有人也在说”没有键盘怎么打字?”、”触摸屏不靠谱”。后来的事我们都知道了。

当然,”无APP手机”现在还只是个6小时做出来的黑客松项目,把它说成”2027年颠覆市场”属于把概念车当量产车卖了。但方向是对的:手机交互正在从”你学App”变成”App学你”,从”你找功能”变成”功能找你”。这个趋势不会回头。

至于什么时候能用上?我赌不会太久。但也不必焦虑,等它真来了,你会发现用起来比想象中自然得多。

────────────────────────────────────────我是新知边界,一个用大白话帮你拆解AI的频道觉得有用,点个关注不迷路

你有什么想用AI搞定的事?评论区聊聊,我帮你出主意!