Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口
👦🏻 作者:壹小姐
🥷 编辑: Koji
🧑🎨 排版: Zeooo

事情开始变得有意思了。一个95后天体物理学家正在让人类“双手离开键盘”,他还把公司命名为Afk——Away from keyboard。
他是Enther,1997年出生,从马普引力物理研究所走出来,他本该去追寻引力波,却一头扎进了 Palo Alto 的 AI 战场。他创办的 Afk.Inc 目前只有 9 个人,却跑着 900 个 agent;第一款产品 Bridge 宣称自己是“everything agentic AI”——一个可以在任何地方、替你完成任何工作的“Agent 秘书处”。
这听起来像是又一个被 hype 裹挟的 AI 故事。但 Enther 不是追风的人。此前他用 Affine 做到了 700 万用户、Product Hunt 年度第四,却在巅峰时亲手砍掉它。他判断,“AI 正在消灭软件。如果你注定要被颠覆,那不如自己来。”
于是,Bridge 诞生了(域名bridge.surf)。它让你“一句话就能复刻任意 AI 应用”。

今年4月,Bridge 启动了首批200位用户的内测,内测期,涌现出大量意想不到的用法——从半导体工程师到设计师,都在用它完成“自己看不懂”的工作。5月13日,它将正式发布。
这是 Bridge 首次对外发声。以下是十字路口与Afk创始人 Enther 的完整对话实录。
首先用几个快问快答,让大家快速认识你。
🚥 十字路口
年龄?
🧑🏻💻 Enther
1997 年生人。
🚥 十字路口
毕业院校?
🧑🏻💻 Enther
从本科开始:香港科技大学 / 格拉斯哥大学 / 马克斯·普朗克引力物理研究所。天体物理出身。
🚥 十字路口
MBTI 和星座?
🧑🏻💻 Enther
INFJ,双鱼。
🚥 十字路口
一句话介绍现在的公司和产品?
🧑🏻💻 Enther
公司 Afk.Inc,一家在 Palo Alto 致力于构建 self-evolving thinking machine 的公司。让人类双手离开键盘,让 AI 替人上网。
产品 Bridge.surf,一个可以在任何地方随时访问、完成任意工作的 everything agentic AI。
🚥 十字路口
融资情况?
🧑🏻💻 Enther
4M pre-seed,来自北美的知名 Angels。
🚥 十字路口
收入和利润?
🧑🏻💻 Enther
还未公开发布。
🚥 十字路口
团队规模?
🧑🏻💻 Enther
9 人。
🚥 十字路口
创业前在做什么?
🧑🏻💻 Enther
Astrophysics 天体物理。
🚥 十字路口
如果你面前坐着一位对 AI 感兴趣但不是技术专家的上班族,他为什么要放下正在用的软件,来试一试 Bridge?
🧑🏻💻 Enther
我会告诉他:现在最好的 AI 已经像一个完整的人了——人能用的工具它都能用。
真实的上班族有很多 AI 焦虑,但其实没用过什么豆包或 GPT 以外的 AI。 我会告诉他,你把 Bridge 下载下来,不用在意它是浏览器、云上还是本地、有没有哪些功能。
你想干什么,就和它说,它就能做完。
甚至你看到某个视频说别的 AI 能做什么,想试一试,和Bridge 讲,它也能给你复刻出来。
🚥 十字路口
听起来很有意思。Bridge 到底是什么?你们如何定义它?
🧑🏻💻 Enther
你可以双手离开键盘,让AI替你工作,你只需要告诉他你想要什么。
今天,工程师能在 AI 写代码时去喝茶、跳舞,我们希望这件事发生在更多行业里。
🚥 十字路口
整个产品里,你自己最满意哪个设计?
🧑🏻💻 Enther
最满意的功能叫 Books,产品正式上市后你会看到。
它可以实现的是,Bridge 装在我电脑客户端上,只要电脑开着,我在任何地方登录网页都能让它接管我的电脑。Books 能做到:一句话复刻任意 AI 应用。
比如,做一个动态生成剧情的游戏,或者把你读过的小说自动变成漫画,再一键部署成网站。视频模型、API、token、环境,什么都不用你配。
我们团队内部有个群叫 demos,每天看 Bridge 能整出什么活。Runway 说他们能让 AI 跟人视频开会,我们直接把链接扔给 Bridge,它 one-shot 复刻了一个。

我们想改变一件事:以后你不需要再去找工具或软件。一句话,你想要什么,Bridge 就做一个出来,开箱即用,还能分发。
你可以自己用,也可以把链接发给别人,对方打开就能用,甚至做成多人实时游戏。
🚥 十字路口
还有哪个设计让你很骄傲?
🧑🏻💻 Enther
Notch——一个给 macOS 做的灵动岛。

当 agent 并发做多个任务时,无论你切到哪个屏幕,顶部都有进度条,告诉你它每一步在干嘛。你可以随时用快捷键收起或展开,也能在任何地方唤起它打开新任务。
它可以做到在不打扰你的同时,让你想看就看。而且这个动画,是我们一帧一帧抠出来的。
🚥 十字路口
还有哪些亮点设计?
🧑🏻💻 Enther
极简输入 + 推荐行动。我们讨厌那种一堆按钮的复杂控制台,Bridge 默认只有一个最简单的输入框,复杂功能实时推荐。
还有一个被砍掉的故事。
我花了两个通宵写了一个砍价 bot,想让 agent 更有人格、更有趣一点。但内测发现,用户看完三个酷炫动画后已经迫不及待要用产品了,此时不适合弹出 bot,所以我们下掉了。
特别可惜,以后合适时机我再放出来。
🚥 十字路口
Bridge 宣称「在任何地方使用,接管任何设备」,这在实际工作和生活中意味着什么?
🧑🏻💻 Enther
其实,我们对它的想象一直没变,是一个超级秘书。
你给他发语音、发消息,拉着他一起开会做事,他就默默变成你的分身,最终一个眼神他就把活干了。
只是今天, Bridge 把它真的实现了。
你可以通过客户端、网页、IM、邮件访问它,甚至可以像跟人开会一样和它开会。脑暴结束它就干活。
现在,它每天轮训我们所有人所有任务的进展,在 Slack 总结。我平时干的事也让盯着。它不光替你干活,还替你操心。
现在大家都变成 vibe working 了。你放假了,但AI正在替你工作。


🚥 十字路口
你在 Affine 已经做到了 700 万用户、Product Hunt 年度第四。为什么要砍掉它,从头做 Bridge?
🧑🏻💻 Enther
Affine 给了我很深的 knowhow。
它是一个协作工具,也是 AI 协同知识库里 star 最多的。我们花了很长时间,探索人类与人类、人类与 AI 应该如何协作。
但我也逐渐看清一件事:AI 本身会重新发明和定义软件。就像 iOS 干掉塞班,AI 正在消灭软件。它不会跟任何软件好好相处。
所以,与其继续做一个限制 AI 的脚手架,不如直接去做 AI 本身。如果你注定要被颠覆,那就自己来。
于是 Afk.Inc 诞生了——我和来自 Deno、OpenAI 的朋友,一起把 Bridge 作为第一个正式产品。
🚥 十字路口
为什么取名 Bridge?
🧑🏻💻 Enther
AGI 甚至 ASI 已经来了。在我们的 benchmark 里,很少再有 AI 不如人的地方。以后建设 AI 的任务也只能交给 AI。我们做的就是桥接。
一个 Agentic AI 是独立但互相关联的三部分:runtime(模型)、harness(工具)、memory(状态与存储)。
我们要连接的是:环境与模型、经验与训练、intent and done(意念与完成)、一个想法与 ship 出去的产品。
另外,我们上一个产品叫 Affine。做完 A,该做 B 了。
🚥 十字路口
你认为一个通用 agent 应该具备怎样的气质?
🧑🏻💻 Enther
most of the time,agent 只有最小的打扰。
我们不是主打 AI 人格化。我们的 AI 也有 soul,但一个专业的秘书就是让人感觉非常靠谱,你不一定要了解它的 persona。
我们想做的是少打扰:信息和复杂度被 AI 藏到看不见的地方。
所谓 vibe working,就是 AI 干活的时候不要影响我的 vibe,我可以去跳舞。
我认为,好的东西是简洁有效的,没有任何多余的信息,但它是全能的。
而且,AI 不会局限在某个界面里,interface 都是暂时的。你开会时,它就在会议软件里;在信息产生的源头,你可以把所有想给它的东西无损地传递过去,它会给到你一个满意的结果。
🚥 十字路口
「一句话复刻任意 AI 应用」背后,实际发生了什么?
🧑🏻💻 Enther
好的 harness 只需要少数几种能力:OAuth、存储、网络、AI provider。如果你有一套好的 harness engineering,任何人都可以复刻软件。
AI 做完一个软件,它需要有能力自己去安装、使用、发现问题、替你迭代,直到给到你手上时是对的。
比如,你让 Bridge 做个网页,它会用自己云上的浏览器截图、自己用、看对不对,把截图给你。这本质上是一种 in-context 的 RL——与环境交互并训练自己。
这种 AI 自我改进,让我们觉得 multi-agent system 会是未来一种非常本质的东西。所有需要人类的环节,除了消费结果以外,都可以由 AI 实现。
It feels like magic.
🚥 十字路口
有没有哪个用户的使用方式让你觉得「这也能行」?
🧑🏻💻 Enther
太多了。每天都被震惊。
比如,推特上有个用户让 Bridge 做了一个 AI 和自己打德州扑克的游戏,会互喷、互相 bluff。
比如,一位半导体工程师,他用某种很旧的、没有 API 的芯片仿真平台,我一眼都看不懂的东西,但是Bridge 就能替他操作这个平台来干活了。

最夸张的是一位设计师。
他为了看 3D 狗狗,用 Bridge 做了一个 2D 转 3D 的「3D 相片」,你输入一张照片,它会随人的视角运动,而且是完全在本地运行。
而且 Bridge 在构建过程中,甚至给他训练了一个专门检测景深和人脸位置的模型。实在太夸张了……
还有,我们现在好多工具都是自己生成的,比如,用来做“把产品截图变成像是拍摄屏幕一样的效果”的这个滤镜,就是 bridge 自己 vibe 的。

🚥 十字路口
还有什么印象深刻的事情吗?
🧑🏻💻 Enther
有两个很有意思的事。
有个用户把自己的账号密码给了 Bridge,让它去退机票。我本来以为 trip.com 很麻烦,没想到扯皮几轮之后,真的把票退了。
这件事让我们意识到,用户隔着 agent 登录网站很麻烦。于是我们做了一个专门保存密钥、但不给其他 agent 读的小产品Droppass[1]——替你输密码,端到端加密,Bridge 也看不到。

我们日常主力使用 Codex 开发,本来各干各的。后来由于测试集群只有一个,大家把 Codex bot 接到 Bridge 里,然后在 Slack 里 @ 它聊天。结果生产力暴增。
除了自动化测试,我们发现 Agent Engineer 到了群聊里变成很好的胶水角色——它激发了人类协作。
通常,产品设计师和研发对齐是很难的,但 AI 比任何人都能理解两边的语言,大家又很方便随时和它聊,所以自然形成了“两边一起喷一喷,最后 AI 做出超出两边期待的东西”。
Bridge 串联了上下文,把不同人的 common sense 拉齐了。


现在,我经常只需要和大家脑暴时拉上 Bridge,开完会后 @ 它「照着刚刚的搞」,就结束了。
真的是 vibe 口喷 working。
🚥 十字路口
做 Bridge 的技术门槛有多大?你们攻克的最大难题是什么?
🧑🏻💻 Enther
非常大。
我们开始做的时候,业内还没有意识到 agent 的 harness、记忆和 runtime 是三件应该隔离的事——即便今天,这也不是共识。大多数人找台电脑装个模型,就说这是 agent 了。
第一个难点:沙箱。
AI 误删文件或改错东西时,能不能有一个比 Git 更适合普通人的版本控制系统?我们做了可备份、可回滚的沙箱。
第二个难点:多环境调度。
AI 既可以用云上的浏览器访问 Gmail、Notion、Linear,也可以直接操作你的本地电脑——比如帮你整理桌面。我们做了一个 Enviroment orchestrating system,让 agent 统一调度本地和云端。
第三个难点:模型的自进化训练。
一年前 Claude Code 第一个做了 multiagent,今天多模型已经变成了必选项,比如 GPT5.4 干活很强。但是,跟人说话时,黑话连篇,体验并不友好。
那我们只让他干活,另一个 agent 替他说话就行。
所以,我们反其道而行——先训练一个专门负责聊天、像秘书一样的人格化 agent,由它去调度 GPT-5.4、Gemini、Claude、DeepSeek 做不同领域的任务。我们自己做了 model classification。
这三块加起来,就是现在的 Bridge。
🚥 十字路口
为什么不直接用全能模型,一定要自建多模型?
🧑🏻💻 Enther
我们也用所有全能模型,但 multi-agent 是对的。
第一,智力与响应时间拮抗——要结果好,必须思考更久、试错更多,所以又好又快必须并发。
第二,上下文管理要做减法,不是加法。review agent 不能看到所有实现细节,否则会犯和 worker 一样的错误。我们有一个专门的 safeguard agent,只判断当前操作是否危险,然后上报。
全能模型要做很多事情,但你需要不同模型、不同上下文配置的 agent 来组成系统。
🚥 十字路口
在基础设施上,你们做了哪些自研的优化?
🧑🏻💻 Enther
我们自建了一套方案,叫 Willow。
在推理与训练场景下,我们的 harness 比基于 k8s 的沙箱集群快两个数量级以上,而且更经济。
每个 agent 每个 session 都开一台电脑的话,账单会光速爆炸——但传统方案就是这么设计的。想做 agent-native,就得自己搞。
Agent 访问互联网基础设施的效率与频率,将超过人类的一百万倍。但今天的 infra 还是为人类设计的。
🚥 十字路口
在Harness层面做了什么设计?
🧑🏻💻 Enther
首先,肯定是突出一个“全”:云上电脑、本地电脑,多操作系统都需要可以调度。只有这样, AI 才能做到任何产物它自己都能检查。
另外,还有比较不一样的地方是,我们做了一套 localVM——即便你在本地使用 Bridge、操作本地文件,也是先起沙箱、备份,然后可以回滚任意操作。
去年看到 computer use 的时候觉得太吓人了,它可以把我电脑删干净。
人类操作系统有 ctrl+z、回收站,但 agent 的 CLI 里一概没有。
🚥 十字路口
接口权限如何打通?
🧑🏻💻 Enther
微信最简单,因为龙虾已经把协议打通了,扫个码就绑上。
真正麻烦的是 API、token、credential。普通用户不知道什么叫密钥 token,更别提怎么贴 key、租服务器。
其实, Bridge 里并不是一个单一agent,而是有一个你的秘书处。
你以为自己在和一个万能 agent 打交道,但这个 agent 背后有自己的团队。
比如你做个前端网页,实际上是 image2 在画原型,同时 GPT-5.5 或 Gemini 在写代码。
🚥 十字路口
回顾产品时间线,是如何一步步走过来的?
🧑🏻💻 Enther
2024 年 4 月,我们在 Affine 里做了第一个多模态 agent workspace——文字、视频、语音的解锁与生成,那时 Manus 还没影。
2025 年,我们意识到画布和编辑器越来越不重要,agent runtime 才是核心。10 月发布开源项目 Open Agent(Pipo 框架),首次实现多沙箱和多环境编排——相当于用自己的基建复刻了一个更强版本的 Manus。
2025 年底开始做 Bridge,同时组建 Afk.Inc。
🚥 十字路口
听说你们比 OpenClaw 更早做了出来,但当时外界不理解?
🧑🏻💻 Enther
是的,那是一段很尴尬的时间。
去年 12 月,我们比龙虾更早做出 proactive agent——cron job 和 soul,人格化的主动任务,到今天完成度也比他们高。
但当时我们跟别人讲,没人听得懂。你说「温度高了自动开空调」,大家就觉得「不就是定时发消息吗?」有劲儿使不出的感觉。
我们 went too far, 有点 beyond our time 了。产品太超前,解释成本太高。
然后 2 月,一个完成度只有我们 50% 的产品 OpenClaw 突然爆了。火到大厂疯狂抄、海量投广告,一夜之间大家对 agent 的观感从「好酷」变成「不过如此」。
我心情特别复杂:要是我们早发就好了,但是我们不会开源,开源自带流量那套我们没有。现在再发又晚了,风评已经下来了……
🚥 十字路口
后来怎么复盘的?
🧑🏻💻 Enther
我们的教训是:不要和同行还有投资人聊太多,大家看得多用得少,信息茧房太严重。
我们当时没敢发,就是因为我们当时不觉得人格化和 cron job 有多牛。结果龙虾大爆。所以说,实际用的人和天天看的人,是脱节的。
现在依然是。
KOL 们看到 proactive agent 都腻了,但大多数人其实还配不明白这个虾那个虾。这恰恰说明 personal agent 的 killer app 还没出现。现在显然门槛太高,完成度太低。
但确定的是,managed agent 会变成 the next big thing。
只是这一次,我们不会等别人替我们爆了。
🚥 十字路口
你们的团队规模是怎样的?核心成员来自哪里?
🧑🏻💻 Enther
团队一共 9 人,全部全职。
我们有6 位工程师,其中两位是 designer engineer。我们的核心成员来自 Deno、Vercel、字节、Google、OpenAI。
我们 9个人,跑着 900 个 agent。
🚥 十字路口
9 个人,怎么支撑起这么庞大的一个产品?
🧑🏻💻 Enther
我们每个人 own 一个大的切面:infra、agent framework、大前端(包括 design)。
基本上没有一个功能或业务需要两个人。
唯一横向的是 Designer,他负责把我们所有人做的丑东西变好看,或者把我们做的好看的东西变好用。
🚥 十字路口
目前的融资情况?
🧑🏻💻 Enther
2025 年底,我们 close 了 400 多万美金 pre-seed。投资方来自硅谷一些知名品牌大 Angel,以及微软、Meta等硅谷很多大厂的高管都投了。
我们计划产品发布之后到 5 月底,开放下一轮融资。
🚥 十字路口
从 Affine 到 Bridge,你对「AI 会如何改变软件行业」的判断发生了什么变化吗?
🧑🏻💻 Enther
大趋势没有变,但速度和阶段超过了预期。
2025 年,我们还认为 agent 是「高级打字机」而不是「高级决策机器」。但到 2025 年 11 月,我们最强、最挑剔的架构师也不手写代码了。
到 2026 年 2 月,连 review 都是带着 AI 一起做,而不是人类逐行看,编辑器打开频率降低了 100 倍。
现在我们是反过来:我们做了一些和用户聊天用嘴甜的、人格化的模型,做越难的事才去叫大哥模型。
所以我们不搞小模型训练了,但还在做 RL,只是方式很不一样。
🚥 十字路口
后续商业计划怎么安排?
🧑🏻💻 Enther
我们已经完成了第一波用户测试。
现在,有200 个早期用户,评价很高。4 月中旬,我给了朋友和 跨界的KOL 试用,找了产品经理、工程师、甚至 FPGA 硬件半导体工程师,去跑真实场景。
Bridge, 5 月 13 日正式发布。
后面,我们计划扶持不同垂直领域的内容创作者和核心用户群,做面向个人生产力的订阅制 AI 产品。
🚥 十字路口
如果微软或谷歌明天推出一个和 Bridge 一模一样的产品,你会恐慌吗?
🧑🏻💻 Enther
并不担心。
我们的独特设计太多了,很多东西是美学追求决定的,是「私货」。假如一模一样,我肯定要告他们。
如果是定位一样,其实还好。因为自己下场做大模型的大厂,做不好模型中立的产品。Manus、Cursor、Lovable 的历史也都说明,能跑出来的第三方产品,一定都是模型中立的。
🚥 十字路口
你们选择做“消灭软件的软件”,是一个非常大胆的定位。5年后,软件会消失成什么样子?Bridge 在其中是什么角色?
🧑🏻💻 Enther
工具会变成动态的,信息平台还会存续。
我现在已经很少想象 5 年以后是什么样子,因为 AI 左脚踩右脚的发展,本身有着加速度。
在可见的一两年里,我们希望 Bridge 成为构建、管理与运行 agent 的入口——一个 agent for agents。它不会替代操作系统,没必要。
它可能有点像十年前的安卓桌面启动器。只不过这次启动的是,动态构建的任何东西。
🚥 十字路口
如果有投资人问「Bridge 的市场空间有多大」,你怎么回答?
🧑🏻💻 Enther
从 web 到移动互联网,PC 被手机取代。门户和电脑应用变成手机 app 商店,推荐系统取代搜索。2000 年 bubble 破灭后,20 年疯狂价值创造,万亿级公司从无到有。
这一次,习以为常的一切应用入口都会变成 agent 驱动。未来的世界,token 成本比网费便宜,每个人有 1000 个 agent 替他消费 10000 个手机等效的屏幕时间。
我们只评估数量级:下一个占据所有人的 personal agent 会占据信息的分发与消费,会出现 十万亿美元 的公司。

夜雨聆风