【导读】YC Spring 2026 的两人团队 AgentPhone 扔出一个问题:当 AI agent 同时拥有电话号码、邮箱、浏览器、钱包和真实 API,它能变成什么?5 月 17 日旧金山,200 个 builder 将在一间屋子里现场回答这个问题——造出最好 agent 的人直通 YC 面试。Google DeepMind、Stripe 等赞助方全部到场。比普通 demo day 激进得多,这是一场把 agent 从「会聊天」推向「会做事」的现场压测。
电话号码、邮箱、浏览器、钱包、真实 API——一次性全交给 agent
5 月 12 日,AgentPhone 官方账号 @AgentPhoneHQ 在 X 上发了一条帖子,配了一张黑底海报。
文案只有几行,但每一行都在加码:
"we're putting 200 builders in a room at YC and asking one question: what can you build when an AI agent has a phone number, email, browser, wallet, and real APIs?"
「我们把 200 个 builder 关进 YC 一间屋子,只问一个问题:当 AI agent 有了电话号码、邮箱、浏览器、钱包和真实 API——你能造出什么?」


▲ AgentPhone 主帖:200 builder、YC 面试保送、赢家拿真手机,3.3 万次浏览
海报信息量拉满:CALL MY AGENT HACKATHON,地点旧金山,时间 5 月 17 日。主办方标识带 YC 和 AgentPhone 的 logo,sponsor 一栏排着Google DeepMind、Stripe、Supermemory、AgentMail、Moss、Browser Use、Sponge。
激励也拉满——
"best agent gets a guaranteed YC interview."
最好的 agent,直接拿到 YC 面试资格。
还有一句半开玩笑的补充:赢家还能拿到 "actual phones"——真手机。
两个人的 YC 公司,API 已经跑起来了
AgentPhone 是 YC Spring 2026 批次的公司,团队只有两个人,总部在旧金山。

▲ YC 公司页:Spring 2026 批次,2 人团队,状态 Active
YC 页面上的定位句值得单拎出来看:
"Agents can't act in the real world today because without a phone number, they have no identity."
「agent 在真实世界里寸步难行,因为没有电话号码,就没有身份。」
想想看:电话号码在现实世界里是什么?是预约的入口、客服的通道、身份验证的默认方式、通知链路的起点。你可以没有 Twitter 账号照样生活,但你试试没有手机号注册一个银行 app、叫一次外卖、打一辆车。
AgentPhone 做的事情就是给 AI agent 发一个属于它自己的电话号码。
跳过模拟和语音合成 demo 那个阶段——真号码、真短信、真语音通话、真实时转录,全走 API。
文档已经在线,26 个工具能力可以直接调
打开 AgentPhone 的官方文档,quickstart 拆成 5 步:创建 agent、申请号码、绑定号码、配置 webhook、开始收消息和接电话。

▲ 官方文档:Quickstart、API Reference、MCP Server、SDK,全部在线
"Give your AI agents their own phone numbers to send SMS, receive calls, and have voice conversations — all through a simple API."
「给你的 AI agent 自己的电话号码,发短信、接电话、语音对话——全部通过一个 API。」
GitHub 仓库 agentphone-mcp 已公开。npm 包 agentphone-mcp 版本号到了 0.5.2,最近一次更新是 4 月 24 日。README 里列了26 个工具能力,覆盖号码管理、短信收发、语音通话、agent 配置、webhook 设置、用量查询。

▲ GitHub 仓库:支持 Cursor、Claude Desktop、Windsurf、Claude Code 等 agent 客户端
三种接入方式:远程 MCP endpoint、本地 stdio、自托管 HTTP。Claude Code、Cursor、Windsurf 都能直接接——加一行 MCP config,你的 agent 就有了电话能力。
Builder 现在就可以动手。
sponsor 名单泄露了一个信号
回头看海报上那排 sponsor:Google DeepMind 做模型,Stripe 做支付,Supermemory 做记忆,AgentMail 做邮箱,Browser Use 做浏览器操作,Moss 和 Sponge 也各有方向。
要注意的是,这些 sponsor 和 AgentPhone 的产品功能是两回事。AgentPhone 自身已经证实的能力集中在电话、短信、语音、API、MCP、Webhook 这一层。邮箱、浏览器、钱包出现在活动命题里,背后对应的是 sponsor 带来的生态能力。
但这个组合释放的信号足够明确:agent 基础设施正在从"比模型"转向"拼工具链"。
单靠一个强模型,agent 最多能回答问题。真要办成一件事——打电话确认预约、发邮件跟进、浏览网页抓取信息、完成支付——需要一整条能力栈。
AgentPhone 做了通信层。这场 hackathon 的意思是:来,把剩下几层也接上,看能拼出什么。
兴奋和警惕同时涌进了评论区
帖子发出后,评论区迅速分出两股声音。
一部分人看到的是机会。有开发者认为,一旦 agent 可以跨真实系统执行动作——打电话、发邮件、访问网页、调 API——workflow 会彻底变化。AI 从"会说"走到"会办事",中间卡住的就是真实世界接口。
另一部分人立刻想到了风险。
@giskyexplorer 的回复很短:
"Phone, email, wallet, browser. Attack surface is the feature."
「电话、邮箱、钱包、浏览器——攻击面本身就是功能。」

▲ @giskyexplorer:能力边界扩大的同时,错误后果也在同步放大
这条回复戳到了要害:当通信、支付、浏览、身份全挂在一个 agent 身上,agent 出错的后果就不再只是"回答跑偏"——它可能打错电话、发错邮件、付错钱、点错按钮。
从这里开始,agent 的核心风险已经从 hallucination(幻觉)升级为 execution risk(执行风险)。
还有人追问按次付费是否支持 x402 或 mpp 协议,官方回复是"正在跟 @paysponge 一起推进"。也有人问能不能线上参赛——公开回复里还没有给出确定答案。
这些追问的方向很一致:builder 已经跳过"能不能做 demo"这一层,直接在问"能不能接进生产环境"。
5 月 17 日,agent 的权限边界要被现场测一次
回看这件事的全貌:
一个两人团队,做了一套可用的 agent 电话基础设施。拉上 Google DeepMind、Stripe 做 sponsor。在 YC 场地办一场 hackathon,把 200 个 builder 关进一间屋子,给出电话、邮箱、浏览器、钱包和真实 API 的接入权限,看他们能跑出什么。
这件事真正值得盯的地方在于:agent 的能力瓶颈正在从"模型能理解什么"转向"agent 被允许做什么"。
当 agent 拿到真实世界的通信权限、操作权限和支付权限,问题就从"AI 够不够聪明"变成了"AI 被放出去之后,谁来划边界"。
5 月 17 日之后,答案可能会更清楚一些。
或者,问题会变得更大。
— END —
夜雨聆风