前沿 · 人机交互
在 OpenAI 主办的一场黑客松上,一位独立开发者用语音“说”出了手机的每一块界面——没有图标,没有应用商店,界面在你开口时才被生成出来。
科技观察 · 编译整理|阅读约 4 分钟
我们用了快二十年的智能手机,底层逻辑其实没怎么变:装 App、点图标、进入一个早就设计好的固定界面。不久前,在 OpenAI 主办的Voice Hack Night(旧金山的一场语音主题黑客松)上,一个名叫 Isa Usmanov的开发者,把这套延续多年的习惯掀翻了。
他带来的项目叫 “Agentic OS for a Phone”(手机版智能体操作系统)。最反直觉的地方在于——手机上没有安装任何常规应用,你看到的每一块界面,都是 AI 在你说话的那一刻临时生成的。
现场演示视频
原始视频来源(开发者本人 / OpenAI 官方推文)
01 先说清楚:这不是 OpenAI 的官方手机
为了不被标题带偏,有个前提得讲明白:这是黑客松上一位独立开发者的个人作品,不是 OpenAI 官方发布的产品。它在活动里入选四强,最终还拿下了由现场观众投票产生的“人气奖”。
1 人 独立开发者单枪匹马完成 | 约 6 小时 从零搭建出原型 | 4 强 黑客松入围决赛 + 人气奖 |
更有意思的是它的搭建方式:开发者表示,整个应用是用OpenAI 的 Codex写出来的,其余部分则由 OpenAI 较新的实时语音模型 Realtime 2驱动。换句话说,这本身就是“用 AI 造 AI 产品”的一个样本。

初始界面:一颗会“变形”的蓝色光球
02 不是“打开 App”,而是“长出界面”
它的核心理念可以浓缩成一句话:UI 即系统。
具体来说,界面不再是一个个提前写死、等你去点的程序,而是 AI 听懂你的意图后,按需当场生成的。演示中,那颗蓝色光球会根据指令,实时变成一张张带有上下文信息的界面:显示价格、时长、航司的机票卡片,干净的日历视图,天气摘要,以及 AI 新闻简报。
过去那套“在不同 App 间反复跳转”的层层操作,被压缩成了一句话。交互的中心,从“应用”挪到了“意图”。
03 全程没碰屏幕,只动了嘴
最有说服力的还是演示本身。开发者举着一台普通手机,全程只用语音,连续完成了一串日常操作,界面则应声而生:
▸订下周晚些时候慕尼黑飞旧金山的机票
▸查看今天的日历安排
▸删掉凌晨 1:30 那个会议
▸看看最新的重要 AI 行业新闻
▸查询旧金山的天气
据报道,手机几乎是即时响应:他口头删掉会议,会议就消失了;他改口问飞里约的航班,新的选项立刻出现。“说话 — 生成 — 反馈”形成了一个完整闭环。

语音生成的机票卡片 / 日历界面
04 它为什么让人想起电影《Her》
很多人看到这个 demo,第一反应是 2013 年那部电影《Her》——男主角和一个会主动理解需求、帮你打理生活的对话式操作系统朝夕相处。这个联想并非偶然:OpenAI CEO 山姆·奥尔特曼曾不止一次说,《Her》是他最喜欢的 AI 电影,并把片中那种人机交互方式,视为人类未来与 AI 相处的一种范本。
从 ChatGPT 的高级语音模式,到如今能“边对话边干活”的实时模型,OpenAI 这几年一直在往“语音原生”的方向走。这位开发者的作品,算是给这个大方向做了一个看得见、摸得着的注脚。
“我从零开始,给自己造了一台智能体手机。我想它能打动人,是因为有这个困扰的不止我一个。”
—— 开发者 Isa Usmanov 在路演中的大意(非逐字原文)
05 对普通人意味着什么
需要泼一盆冷静的水:这只是一个黑客松原型,离“揣进每个人口袋里的成熟产品”还隔着很长的距离,稳定性、隐私、成本、复杂任务的可靠性,都还是大问号。
但它确实让人看清了一种可能:当界面可以被即时生成,“装一堆 App”这件事本身,或许会慢慢变成上一个时代的习惯。对开发者,要重新想“功能该怎么交付”;对我们,则要慢慢适应从“找 App”到“说需求”的转变。至于这条路最终能走多远,还得交给时间。
来源:Eyerys、OpenAI Developers(@OpenAIDevs)、开发者@isausmanov 公开推文,综合整理编译。
夜雨聆风