AI agent 拿到「电话号码+邮箱+浏览器+钱包+真实 API」全套权限!YC 两人团队把 200 个 builder 关进一间屋子,赢家直通 YC 面试

导读
【导读】YC Spring 2026 的两人团队 AgentPhone 扔出一个问题：当 AI agent 同时拥有电话号码、邮箱、浏览器、钱包和真实 API，它能变成什么？5 月 17 日旧金山，200 个 builder 将在一间屋子里现场回答这个问题——造出最好 agent 的人直通 YC 面试。Google DeepMind、Stripe 等赞助方全部到场。比普通 demo day 激进得多，这是一场把 agent 从「会聊天」推向「会做事」的现场压测。

电话号码、邮箱、浏览器、钱包、真实 API——一次性全交给 agent

5 月 12 日，AgentPhone 官方账号 @AgentPhoneHQ 在 X 上发了一条帖子，配了一张黑底海报。

文案只有几行，但每一行都在加码：

"we're putting 200 builders in a room at YC and asking one question: what can you build when an AI agent has a phone number, email, browser, wallet, and real APIs?"

「我们把 200 个 builder 关进 YC 一间屋子，只问一个问题：当 AI agent 有了电话号码、邮箱、浏览器、钱包和真实 API——你能造出什么？」

▲ AgentPhone 主帖：200 builder、YC 面试保送、赢家拿真手机，3.3 万次浏览

海报信息量拉满：CALL MY AGENT HACKATHON，地点旧金山，时间 5 月 17 日。主办方标识带 YC 和 AgentPhone 的 logo，sponsor 一栏排着Google DeepMind、Stripe、Supermemory、AgentMail、Moss、Browser Use、Sponge。

激励也拉满——

"best agent gets a guaranteed YC interview."

最好的 agent，直接拿到 YC 面试资格。

还有一句半开玩笑的补充：赢家还能拿到 "actual phones"——真手机。

两个人的 YC 公司，API 已经跑起来了

AgentPhone 是 YC Spring 2026 批次的公司，团队只有两个人，总部在旧金山。

▲ YC 公司页：Spring 2026 批次，2 人团队，状态 Active

YC 页面上的定位句值得单拎出来看：

"Agents can't act in the real world today because without a phone number, they have no identity."

「agent 在真实世界里寸步难行，因为没有电话号码，就没有身份。」

想想看：电话号码在现实世界里是什么？是预约的入口、客服的通道、身份验证的默认方式、通知链路的起点。你可以没有 Twitter 账号照样生活，但你试试没有手机号注册一个银行 app、叫一次外卖、打一辆车。

AgentPhone 做的事情就是给 AI agent 发一个属于它自己的电话号码。

跳过模拟和语音合成 demo 那个阶段——真号码、真短信、真语音通话、真实时转录，全走 API。

文档已经在线，26 个工具能力可以直接调

打开 AgentPhone 的官方文档，quickstart 拆成 5 步：创建 agent、申请号码、绑定号码、配置 webhook、开始收消息和接电话。

▲ 官方文档：Quickstart、API Reference、MCP Server、SDK，全部在线

"Give your AI agents their own phone numbers to send SMS, receive calls, and have voice conversations — all through a simple API."

「给你的 AI agent 自己的电话号码，发短信、接电话、语音对话——全部通过一个 API。」

GitHub 仓库 agentphone-mcp 已公开。npm 包 agentphone-mcp 版本号到了 0.5.2，最近一次更新是 4 月 24 日。README 里列了26 个工具能力，覆盖号码管理、短信收发、语音通话、agent 配置、webhook 设置、用量查询。

▲ GitHub 仓库：支持 Cursor、Claude Desktop、Windsurf、Claude Code 等 agent 客户端

三种接入方式：远程 MCP endpoint、本地 stdio、自托管 HTTP。Claude Code、Cursor、Windsurf 都能直接接——加一行 MCP config，你的 agent 就有了电话能力。

Builder 现在就可以动手。

sponsor 名单泄露了一个信号

回头看海报上那排 sponsor：Google DeepMind 做模型，Stripe 做支付，Supermemory 做记忆，AgentMail 做邮箱，Browser Use 做浏览器操作，Moss 和 Sponge 也各有方向。

要注意的是，这些 sponsor 和 AgentPhone 的产品功能是两回事。AgentPhone 自身已经证实的能力集中在电话、短信、语音、API、MCP、Webhook 这一层。邮箱、浏览器、钱包出现在活动命题里，背后对应的是 sponsor 带来的生态能力。

但这个组合释放的信号足够明确：agent 基础设施正在从"比模型"转向"拼工具链"。

单靠一个强模型，agent 最多能回答问题。真要办成一件事——打电话确认预约、发邮件跟进、浏览网页抓取信息、完成支付——需要一整条能力栈。

AgentPhone 做了通信层。这场 hackathon 的意思是：来，把剩下几层也接上，看能拼出什么。

兴奋和警惕同时涌进了评论区

帖子发出后，评论区迅速分出两股声音。

一部分人看到的是机会。有开发者认为，一旦 agent 可以跨真实系统执行动作——打电话、发邮件、访问网页、调 API——workflow 会彻底变化。AI 从"会说"走到"会办事"，中间卡住的就是真实世界接口。

另一部分人立刻想到了风险。

@giskyexplorer 的回复很短：

"Phone, email, wallet, browser. Attack surface is the feature."

「电话、邮箱、钱包、浏览器——攻击面本身就是功能。」

▲ @giskyexplorer：能力边界扩大的同时，错误后果也在同步放大

这条回复戳到了要害：当通信、支付、浏览、身份全挂在一个 agent 身上，agent 出错的后果就不再只是"回答跑偏"——它可能打错电话、发错邮件、付错钱、点错按钮。

从这里开始，agent 的核心风险已经从 hallucination（幻觉）升级为 execution risk（执行风险）。

还有人追问按次付费是否支持 x402 或 mpp 协议，官方回复是"正在跟 @paysponge 一起推进"。也有人问能不能线上参赛——公开回复里还没有给出确定答案。

这些追问的方向很一致：builder 已经跳过"能不能做 demo"这一层，直接在问"能不能接进生产环境"。

5 月 17 日，agent 的权限边界要被现场测一次

回看这件事的全貌：

一个两人团队，做了一套可用的 agent 电话基础设施。拉上 Google DeepMind、Stripe 做 sponsor。在 YC 场地办一场 hackathon，把 200 个 builder 关进一间屋子，给出电话、邮箱、浏览器、钱包和真实 API 的接入权限，看他们能跑出什么。

这件事真正值得盯的地方在于：agent 的能力瓶颈正在从"模型能理解什么"转向"agent 被允许做什么"。

当 agent 拿到真实世界的通信权限、操作权限和支付权限，问题就从"AI 够不够聪明"变成了"AI 被放出去之后，谁来划边界"。

5 月 17 日之后，答案可能会更清楚一些。

或者，问题会变得更大。

— END —