手机上没有一个 App!OpenAI 黑客松冠军项目「Agentic OS」震撼演示:你说话,AI 替你操作一切

导读
OpenAI Voice Hack Night 黑客松落幕，一个叫 Agentic OS for a Phone 的项目拿下 People's Choice 大奖和 5 万美元 API credits。它展示的手机上没有任何传统 App，所有界面由 AI 实时生成，用户只需开口说话，agent 就能订机票、删日历、发邮件。Humane、Rabbit 没做成的事，这次有人直接在手机上做出了 demo。

一个黑客松项目，让 OpenAI 官方开发者账号亲自下场宣传

5 月 27 日，旧金山，OpenAI 总部。

一场名为 Voice Hack Night 的黑客松在这里举行，主办方是 OpenAI 和 Cerebral Valley。参赛要求很明确：用 OpenAI 最新一代实时语音模型，做出能跑的原型。

比赛结束后，OpenAI Developers 官方账号直接发帖公布了 People's Choice 获奖者——

"The votes are in. @isausmanov's Agentic OS for a Phone is the Voice Hack Night People's Choice winner. A voice-first mobile OS. Users talk, agents answer and take action across the phone. Congrats to the team on taking home $50,000 in API credits."

「投票结果出炉。@isausmanov 的 Agentic OS for a Phone 拿下 Voice Hack Night 人民选择奖。一个语音优先的手机操作系统——用户说话，agent 回答并在手机上采取行动。恭喜团队赢得价值 5 万美元的 API 积分。」

▲ OpenAI Developers 官方账号宣布获奖结果，7.8 万次浏览

注意几个关键词：voice-first mobile OS，take action across the phone，$50,000 in API credits。

这说明两件事。第一，OpenAI 对这个项目的定义很高——直接叫它「语音优先的手机操作系统」。第二，奖励是 API credits，说明 OpenAI 希望这类项目继续用自家模型往下做。

手机上零 App，所有界面由 AI 实时生成

这个 demo 到底展示了什么？

据 Aibase 对现场演示的报道，测试手机上没有安装任何传统 App。所有操作界面由设备上的本地模型根据用户指令实时生成。项目的核心设计理念可以概括为四个字：UI is the system——界面本身就是系统。

具体的交互方式是这样的：

用户用语音下达指令
简单任务由本地模型直接处理并生成临时界面
需要深度理解和跨应用逻辑的复杂任务，交给云端 GPT 大模型

现场演示中，开发者用语音完成了：订机票、删除日历事件、搜索最新 AI 新闻、发送邮件、整理待办事项——全程没有打开任何一个 App。

▲ Aibase 报道标题：Redefining Traditional Interaction! OpenAI Demonstrates a Phone Without Apps

这意味着什么？传统手机交互是：解锁 → 找 App → 打开 → 找入口 → 填表单 → 点确认。Agentic OS 的逻辑是：你说目标，系统替你完成。中间那些步骤，全部由 agent 代劳。

获奖者的野心：Humane 和 Rabbit 的方向没错，只是时机不对

获奖者 Isa（@isausmanov）在赛后发了一条帖：

"Just won OpenAI Hackathon at their HQ. Built an agentic OS for a mobile device. Two safe plays right now: join an AI lab, or wrap LLMs in B2B SaaS and call it Agents. I am bullish that the most exciting products of this decade will emerge in physical AI. Humane, Rabbit, Friend — those are not category mistakes. They are timing and vision mistakes. Timing just flipped."

「刚在 OpenAI 总部赢了黑客松。为移动设备构建了一个 agentic OS。现在有两个"安全玩法"——加入 AI 实验室，或者把 LLM 包装成 B2B SaaS 然后管它叫 Agents。我坚信这十年最激动人心的产品会出现在 physical AI 领域。Humane、Rabbit、Friend——它们犯的不是品类错误，而是时机和愿景的错误。时机刚刚翻转。」

▲ 获奖者 Isa 发文回顾，2.9 万次浏览

这段话信息量很大。

Isa 把矛头指向了当前 AI 创业的两条"安全路线"：要么进大厂实验室打工，要么把 LLM 套一层壳卖给企业。他认为真正的机会在 physical AI——让 AI 进入物理设备，改变人和硬件的交互方式。

更耐人寻味的是他对 Humane AI Pin、Rabbit R1、Friend 这几个产品的评价。过去一年，这些产品被市场狠狠教训过——Humane AI Pin 上市即翻车，Rabbit R1 被嘲讽为"最贵的 ChatGPT 皮肤"。但 Isa 的判断是：方向本身没问题，失败在于出手太早、产品想象力不够。

而他的选择是：不做新硬件，直接在手机上搭 agentic OS。这绕开了"让用户多带一个设备"的致命问题。

社区争论：这到底是操作系统级突破，还是又一个 GPT Wrapper？

OpenAI Developers 的帖子发出后，评论区迅速分成两派。

支持者认为语音优先手机 OS 是自然方向。手机使用场景里，双手经常被占——做饭、开车、带孩子。如果 agent 能跨工具执行任务，传统 App 可能退化为后台实现细节。

质疑者则集中在三个问题上：

第一，这真的是"across the phone"吗？有人直接回复说，实际能力更可能是"across connections"——意思是它调用的是外部服务接口，并没有真正控制手机本地系统 API。如果是这样，那它本质上就是一个更好看的 GPT wrapper。

第二，agent 帮你做事，你敢信任吗？多条评论反复提到同一组词：permissions、confirmations、approvals、audit、rollback、predictability、reversibility、visible enough to trust。翻译过来就是：权限怎么管、操作前确认吗、能撤销吗、有操作记录吗、出了错谁负责。

聊天 agent 答错了，你关掉窗口就行。但手机级 agent 一旦帮你订了错误航班、删了重要日程、给老板发了不该发的邮件——错误成本完全不同。

第三，纯语音交互够用吗？语音适合下达目标，但复杂任务需要可视化确认。Aibase 提到的"UI is the system"和实时生成界面，可能就是为了解决这个问题：语音并不会取代屏幕，真正的交互模型是语音触发 + 界面按需生成 + 关键节点让用户确认。

5 万美元 API Credits 背后的生态信号

最后值得注意的是奖励形式。

5 万美元，给的是 API credits，不是现金，不是投资，不是收购。OpenAI 没有宣布把 Agentic OS 纳入官方产品线，但愿意通过开发者账号把它推给整个社区。

这是一个生态激励信号：OpenAI 在鼓励开发者围绕实时语音模型、agents 和移动端 UX 继续探索。Voice Hack Night 本身的活动设计也印证了这一点——参赛者的终极目标就是被 @OpenAIDevs 展示并接受社区投票。

▲ Cerebral Valley 活动页显示，Voice Hack Night 由 OpenAI 与 Cerebral Valley 共同组织

换句话说，OpenAI 的策略已经摆在台面上：自己不急着做手机 OS，但会给做这件事的开发者弹药。

回到这件事本身

Agentic OS for a Phone 目前仍然是一个黑客松 demo，距离真正的产品还有很长的路。

但它提出的问题已经足够真实：如果手机的交互起点从"找 App"变成"说目标"，从"用户操作"变成"agent 代劳"，那 App 生态、权限模型、用户信任机制，全都要重新设计。

下一步要看的是：有没有代码开源、有没有产品化路线图、权限模型怎么做、真实设备上跑起来是什么效果。

在那之前，这至少是一个让人认真想一想的 demo。

— END —