OpenAI 现场演示:无 App 手机界面实时生成,复杂算力全丢给云端 GPT

前沿 · 人机交互

在 OpenAI 主办的一场黑客松上，一位独立开发者用语音“说”出了手机的每一块界面——没有图标，没有应用商店，界面在你开口时才被生成出来。

科技观察 · 编译整理|阅读约 4 分钟

我们用了快二十年的智能手机，底层逻辑其实没怎么变：装 App、点图标、进入一个早就设计好的固定界面。不久前，在 OpenAI 主办的Voice Hack Night（旧金山的一场语音主题黑客松）上，一个名叫 Isa Usmanov的开发者，把这套延续多年的习惯掀翻了。

他带来的项目叫 “Agentic OS for a Phone”（手机版智能体操作系统）。最反直觉的地方在于——手机上没有安装任何常规应用，你看到的每一块界面，都是 AI 在你说话的那一刻临时生成的。

现场演示视频

已关注

关注

重播分享赞

视频详情

原始视频来源（开发者本人 / OpenAI 官方推文）

01 先说清楚：这不是 OpenAI 的官方手机

为了不被标题带偏，有个前提得讲明白：这是黑客松上一位独立开发者的个人作品，不是 OpenAI 官方发布的产品。它在活动里入选四强，最终还拿下了由现场观众投票产生的“人气奖”。

1 人

独立开发者单枪匹马完成

约 6 小时

从零搭建出原型

4 强

黑客松入围决赛 + 人气奖

更有意思的是它的搭建方式：开发者表示，整个应用是用OpenAI 的 Codex写出来的，其余部分则由 OpenAI 较新的实时语音模型 Realtime 2驱动。换句话说，这本身就是“用 AI 造 AI 产品”的一个样本。

初始界面：一颗会“变形”的蓝色光球

02 不是“打开 App”，而是“长出界面”

它的核心理念可以浓缩成一句话：UI 即系统。

具体来说，界面不再是一个个提前写死、等你去点的程序，而是 AI 听懂你的意图后，按需当场生成的。演示中，那颗蓝色光球会根据指令，实时变成一张张带有上下文信息的界面：显示价格、时长、航司的机票卡片，干净的日历视图，天气摘要，以及 AI 新闻简报。

过去那套“在不同 App 间反复跳转”的层层操作，被压缩成了一句话。交互的中心，从“应用”挪到了“意图”。

03 全程没碰屏幕，只动了嘴

最有说服力的还是演示本身。开发者举着一台普通手机，全程只用语音，连续完成了一串日常操作，界面则应声而生：

▸订下周晚些时候慕尼黑飞旧金山的机票

▸查看今天的日历安排

▸删掉凌晨 1:30 那个会议

▸看看最新的重要 AI 行业新闻

▸查询旧金山的天气

据报道，手机几乎是即时响应：他口头删掉会议，会议就消失了；他改口问飞里约的航班，新的选项立刻出现。“说话 — 生成 — 反馈”形成了一个完整闭环。

语音生成的机票卡片 / 日历界面

04 它为什么让人想起电影《Her》

很多人看到这个 demo，第一反应是 2013 年那部电影《Her》——男主角和一个会主动理解需求、帮你打理生活的对话式操作系统朝夕相处。这个联想并非偶然：OpenAI CEO 山姆·奥尔特曼曾不止一次说，《Her》是他最喜欢的 AI 电影，并把片中那种人机交互方式，视为人类未来与 AI 相处的一种范本。

从 ChatGPT 的高级语音模式，到如今能“边对话边干活”的实时模型，OpenAI 这几年一直在往“语音原生”的方向走。这位开发者的作品，算是给这个大方向做了一个看得见、摸得着的注脚。

“我从零开始，给自己造了一台智能体手机。我想它能打动人，是因为有这个困扰的不止我一个。”

—— 开发者 Isa Usmanov 在路演中的大意（非逐字原文）

05 对普通人意味着什么

需要泼一盆冷静的水：这只是一个黑客松原型，离“揣进每个人口袋里的成熟产品”还隔着很长的距离，稳定性、隐私、成本、复杂任务的可靠性，都还是大问号。

但它确实让人看清了一种可能：当界面可以被即时生成，“装一堆 App”这件事本身，或许会慢慢变成上一个时代的习惯。对开发者，要重新想“功能该怎么交付”；对我们，则要慢慢适应从“找 App”到“说需求”的转变。至于这条路最终能走多远，还得交给时间。

来源：Eyerys、OpenAI Developers（@OpenAIDevs）、开发者@isausmanov 公开推文，综合整理编译。