第一个全职AI CEO来了!29岁前编程神童正让AI替他管理千人公司

8 岁自学编程,12 岁成功越狱 iPhone,14 岁靠一款 App 赚到了 30 万美元。在还没到法定饮酒年龄之前,就打造了巴西最大的支付公司之一,随后又创立了 Brex,并最终以 51.5 亿美元的价格卖给了美国银行巨头 Capital One——出走半生,归来竟仍未满 30 岁。在不乏天才故事的 AI 圈,Pedro Franceschi 的成长经历依然显得极为硬核。
当许多管理者还在探索如何培养好用的 AI 员工时,Pedro 已经搓出了一个能够“替自己上班”的全职 AI CEO。“我正在用 OpenClaw 运行整个 Brex。”他如是说。那么,他究竟是如何用 AI 处理 CEO 那些复杂的日常沟通与管理决策的?
近日,在一期播客节目中,Brex 创始人 Pedro Franceschi 与主持人 Ashlee Vance 一起,完整回顾了他跌宕起伏的人生旅程:从童年因父亲罹患癌症去世通过写代码来对抗悲伤,到后来在金融科技领域创业一路高歌猛进,再到如今由 AI agents 接管生活和工作。
核心观点如下:
-
好奇心、精力、投入当然都很重要。但对我来说,这一切最终都来自一种非常强烈的创作驱动,而不是传统意义上的“工作”心态,不是那种“我必须完成任务、赚到钱”的想法。
-
Opus 4.5 已经是 AGI,或者至少已经非常接近 AGI;而 Opus 4.6,则是在把那些还略显粗糙的边角进一步打磨完善。
-
当你有一个像 OpenClaw 这样的 agent 在运行时,最好的监控方式不是让人类盯着,而是让另一个 LLM 来盯着。
-
你无法简单论证“招一个从小自学代码的人”和“招一个在 OpenAI 或 Anthropic 做研究的机器学习博士”哪个更好,这完全取决于你想构建什么样的公司。如果把非核心的杂事都交给模型,剩下的这些需要极高洞察力的问题,才是人们真正应该投入精力的地方。
下文基于播客视频整理,经 InfoQ 编辑。
Pedro:是的,我觉得我人生中最大的幸运,就是在八九岁的时候就找到了自己真正热爱的事情。
我是在巴西长大的,来自里约。八岁那年,我父亲去世了。他是个很典型的“技术宅”,经常待在电脑前。我们家当时有一台电脑,在那个年代的巴西其实挺少见的。电脑从一开始就一直在我的生活里。
大概在八九岁的时候,我对电脑产生了一种很强烈的好奇心,特别想搞清楚它是怎么运作的。有一天我甚至把电脑拆开看,但发现里面其实没什么“有意思”的东西。我当时就想,那一定还有别的东西在背后,让这一切变得这么神奇。后来我意识到,是软件。
在巴西,我当时其实完全没有接触软件工程的渠道,但互联网已经存在了。互联网是个非常神奇的东西,它让像我这样的人,可以学到原本根本接触不到的知识。于是我开始在 Google 上搜索“怎么写代码”,大概九岁时开始学 C 和 C++。那时候一边学编程,一边还在学英语,其实挺难的,而且 C 也不算是对初学者友好的语言。但那是 2004、2005 年左右,我能找到的资源基本也就这些,这就是我最初开始写代码的背景。
真正让我着迷的是,电脑给了你一种能力:你几乎不需要任何许可,就可以把脑子里的想法变成现实。
大概到 12 岁的时候,我的技术已经稍微成熟一点了,正好那时 Apple 推出了 iPhone。2008 年左右,iPhone 在美国只能用 AT&T 的网络。所以当你想在其他国家使用 iPhone 时,就必须进行 jailbreak(越狱)再加上运营商解锁。我当时就在用各种网上的工具去做这些事情,后来 Apple 推出了 iPhone 3G,我找到了一个越狱的方法,于是我在那个 iPhone 越狱社区里逐渐有了一点名气。
这件事后来甚至变成了我工作的起点。有个巴西的记者注意到,有个小孩在网上做这些越狱相关的事情。他发现我是巴西人,我猜可能是因为 IRC 论坛里的 IP 地址。他联系我说:“我们发现有个巴西人参与了 iPhone 越狱社区,你多大?我想了解一下你。”我当时心想,如果我说我 12 岁,肯定没人会认真对待我,所以我告诉大家我 14 岁。在我看来,这差别可太大了。
那之后,我开始在巴西媒体上被提及,然后有一家做移动应用的公司联系了我。一开始我跟我妈说:“有家公司想雇我。”她的第一反应是:“不可能,你才 12 岁,开什么玩笑。”但我说服她陪我一起去面试。那段经历对我来说特别重要,因为我第一次接触到了真正的职业软件工程师,第一次真正见识到,所谓“世界级”工程师到底是什么样。我的第一任老板 Ben Jackson 非常厉害,他后来去了 New York Times,做过他们的移动端产品。
到了 14 岁,我做了两件事,让我“惹上了一点麻烦”。第一件是我通过 reverse engineering(逆向工程),把 Siri 改造成可以说葡萄牙语,Apple 对这件事非常不高兴。第二件是我开发了一个叫 Quazar 的 iPad 应用。它可以让你在 iPad 上运行 Windows 应用,就像现在可以做到的那样,但那是 2012 年,已经是 14 年前了。我把这个应用发布到一个类似“平行 App Store”的平台上,每次下载收费 10 美元。结果我在 14 岁时赚了大概 30 万美元。我还得向我妈解释这笔钱是怎么来的,她一开始以为我在网上做了什么违法的事情。
我觉得父母有时候会做出一些当下看起来很普通,但后来却会彻底改变孩子人生轨迹的决定。
我记得大概就在那个时候,媒体上有很多文章,说比尔·盖茨的女儿每天只能用 45 分钟电脑。我妈妈看到这些,再看看她自己的儿子——每天在电脑前待 14 个小时——心里大概会想:“比尔·盖茨对电脑总比我懂,那我怎么能允许这种事?”但她后来做了一个非常关键的判断:她意识到我不是在玩游戏,而是在“创造东西”,而且这些东西对别人是有价值的。
这种“builder(创造者)”的状态,也是我人生最大的幸运,她看到了这件事对我、以及对使用我产品的人产生的影响。这让她决定支持我:不仅允许我长时间待在电脑前,还愿意让我去工作,哪怕这件事在常规认知里完全不合理。当时身边的亲戚朋友都在问她:“你儿子才 12 岁,为什么要去上班?”她的回答是:“你们不懂,他是自己想去的。”如果她当时没有做这个决定,我的人生轨迹可能会完全不同。
Pedro:我们其实是和那家公司的两位创始人一起吃了顿午餐。我在和他们聊技术、聊我做的东西,我妈在旁边完全听不懂,但她能感觉到他们很兴奋,于是她觉得:“好吧,这大概是好事。”最后他们说:“我们觉得他很不错,想和他一起工作。”我妈说:“我只有一个要求,他才 12 岁,如果他出了什么事,我会杀了你们。”他们当时就说:“好的,明白。”
她其实非常保护我。但那确实是一个很不寻常的环境,公司里第二年轻的人大概 26 岁,而我 12 岁。说实话,如果是我自己的孩子,我不一定有勇气做出同样的决定。但她当时做了,而结果也证明,一切都朝着好的方向发展了。
Pedro:我觉得可以用 Paul Graham 的一个说法来解释。他写过一篇文章,里面提到过所谓的“公交车票天才理论”(bus ticket theory of genius)。大意是,那些看起来很琐碎、很不起眼,甚至有点无聊的痴迷,如果在一个人的生命里不断累积,最后往往会把你带到一个非常有意思的位置。
对我来说,最底层的驱动力一直都是一种很强的好奇心:我特别想让计算机去做一些它本来不该做、也不是被设计来做的事情,然后从技术上证明,这件事其实是做得到的。
另一个很重要的因素是,我开始得很早。你在 12 岁、14 岁那样的年纪去创造东西,那种创作冲动是非常纯粹的,因为你没有什么外在动机。你不是为了赚钱,也不是为了谋生。
我很幸运。虽然我家不算富裕,但在巴西大概算是典型的中产,所以我不需要靠这些事情养活自己。我之所以去做,完全是因为我真的对这件事本身着迷。
所以一直以来,对我最重要的都是那种“我想把它做出来”的冲动。当你脑子里有一个想法时,你会忍不住一直想:我到底怎样才能让它在现实里存在?
我记得当时做那个 iPad 项目,技术上其实非常复杂。你要让 iPad 从原本单进程的 UI 渲染,变成多进程同时处理界面,这意味着你得写一个 scheduler,去协调不同任务如何在屏幕上并发渲染。在当时,这其实是很难的一件事。但我当时就是有一种很强的直觉,觉得它一定可以做到。
而一旦你和某个“你真的很希望它存在于这个世界上的东西”建立起连接,你投入的时间、精力,甚至感知世界的方式,都会发生变化。某种意义上,你是在臣服于那个创造过程。
我作为一个 builder 的成长,某种程度上其实就是不断去寻找:怎样重新连接到这种能量。
到了今天,做 AI、做很多新的项目时,哪怕我已经身处一家 1300 人规模的公司里,我还是会努力回到那种最初的状态——不是因为这是一项工作,而只是因为:这件事很酷,我想把它做出来。
好奇心、精力、投入当然都很重要。但对我来说,这一切最终都来自一种非常强烈的创作驱动,而不是传统意义上的“工作”心态,不是那种“我必须完成任务、赚到钱”的想法。
Pedro:差不多就是这样。后来我赚到第一笔钱之后,给自己买了一台 iMac。再后来,几乎就是我和那台电脑一起度过了无数个小时,一直在写代码。当时用的是 Vim、TextMate 这些编辑器。
我还长期泡在很多 IRC 频道里,也是在那里知道了 GeoHot,认识了 Cydia、MobileSubstrate 那些早期越狱社区的人。那时候有很多不同的小圈子和技术小组。对我来说,那几乎就是我的整个世界,像是生活在一个“平行宇宙”里。
Pedro:绝对是。
Pedro:我有个弟弟,小我两岁。
Pedro:他在我八岁时去世,大概生病了六年,所以基本贯穿了我整个童年。他得的是 lymphoma(淋巴瘤),算是比较少见的一种癌症。在那几年里状态反复,有时候很好,有时候又不太好。这件事确实是我童年非常重要的一部分。
Pedro:我大概是五年前才真正“消化”这件事。当你长大之后,有了更多人生经验,开始意识到生命是有限的,你才会重新去理解童年经历过的那些事情,重新赋予它们意义。
在当时它肯定对我产生了影响。我觉得我后来沉浸在“创造”和“写代码”里,其实某种程度上,是在寻找一个完全可控的世界,一个所有变量都由你掌控的空间,因为现实世界不是这样的。
我妈妈在父亲去世后把我和弟弟带大,她做得非常好。但你确实会在很小的时候就意识到:人生不是无限的,坏事会发生。这些都会在某种程度上塑造你的大脑和性格。
Pedro:完全没有。那时候我的计划就是一辈子待在里约。其实很多在里约出生、长大的人都会这么想,我也完全能理解,因为那座城市真的非常好。
比如我弟弟现在 27 岁,就是一个很典型的 carioca,也就是那种非常地道的里约人。我觉得他大概率这辈子都不会离开里约。
我原本的人生轨迹其实也是这样。直到 2013 年,我们在巴西创办了第一家公司,那也是我第一次真正离开里约,搬到圣保罗。后来我开始申请美国的学校,因为我一直想做的是那种“美国规模”的产品,而当时巴西还没有太多大型科技公司。
2016 年,在我们做完第一家公司 Pagar.me——本质上就是巴西版的 Stripe——之后,我们搬到了美国。
Pedro:最好笑的地方就在这儿:我们当时根本不知道。我们一开始以为自己是“原创”这个想法的人,我们只是觉得,支付对开发者来说做得太差了,应该有人把它重新做一遍,做得更好。
后来有人问我们:“你们这是在做 Stripe 吗?”我们才问:“Stripe?那是什么?”后来我们见到了 Patrick 和 John,之后也一直有联系。我们非常尊敬他们。
Pedro:其实挺偶然的。我 14 岁时换了一份工作,去了一家做移动支付的公司,最初他们找我是为了修一个 iOS 的安全问题。但在那里,我第一次深入接触支付行业,很快就意识到,这个行业的系统非常老旧、非常糟糕。
后来我认识了我的合伙人 Henrique。他那边的痛点是:作为开发者,很难接入在线支付,没有好的解决方案。而我刚好在支付公司内部,看到了这些系统有多糟。所以这基本就是“1 + 1 = 3”的组合。
我们后来开始做这件事,也越来越深入理解支付行业。其中一个对我们来说非常关键的理念是:一定要“从底层往上构建”。因为大多数支付公司,都会受限于他们依赖的那些底层供应商,比如 Visa、Mastercard、ACH、Fedwire 这些基础设施。
作为工程师,我有一种近乎“宗教式”的信念:如果你不能控制整个技术栈,你就不可能真正做出本质上更好的用户体验。这其实有点像 Steve Jobs 说的,如果你既在意软件,又在意硬件,那你就应该自己把硬件也做了,实现垂直整合。
我们在巴西成立的第一家公司就是这么做的,我们自己搭建了整套支付处理系统,包括 收单链路,以及 Visa/Mastercard 的接入等等。后来到了 Brex ,我们又把这件事重新做了一遍。我认为,这其实是我们后来很多成功背后的一个关键原因,也是我们真正开始创新的起点。正是因为我们把这种垂直整合能力内建到了整个产品里,我们才得以去服务很多大型企业客户,包括 AI 公司。
我觉得工程师思维其实塑造了我们后来打造这两家公司的方式。
Pedro:其实是他劝我去申请的。我第一次听说 SAT 是在 9 月中旬,而申请截止是 12 月,所以那两个月半非常“高强度”。
Pedro:那不是一开始的计划,但时间上确实差不多,我们待了三个 quarter。
Pedro:我们在巴西做了四五年的 fintech,等我们来到美国时,我们的想法是:fintech 在美国已经是“已解决的问题”,而巴西才是那个“很糟糕、还有机会”的地方。所以当时我们的想法反而是,不如去做一些更前沿的技术。
于是 2016 年,我们去 Stanford Shopping Mall 的 Microsoft Store,体验了最早期的 Oculus 原型机(应该是 Oculus Rift 的早期版本)。当时我们被震撼到了,就想:“那我们也来做这个吧。”现在回头看挺天真的,我们花了两三周时间研究,很快意识到我们对硬件和光学都一无所知。
于是我们很快决定转回更熟悉的软件领域,大概三四周内就完成了 pivot。
在 YC 期间,我们观察到一个现象:所有创业公司都需要企业卡(corporate card),但却拿不到。他们去找银行,银行说:“你们没有收入历史。”创业者说:“对啊,我是创业公司——这不正是问题所在吗?”
Pedro:对。我们当时就觉得,这件事不合理:如果他们的账户里明明有钱,风险到底在哪里?但银行并不这么看。所以,Brex 最初的核心思路就是:不看历史收入,而是基于账户现金余额来做授信评估。从本质上讲,我们想打造的,是一个“更好的 American Express”。这就是最初的理念。
Pedro:有这个说法,“Brazilian Express”。更现实一点的原因是,它是一个由四个字母组成、在英文里容易发音的域名,同时背后刚好也能讲出这个故事。
还有一个挺有意思的现象:一个国家经济越发达,它的支付系统反而可能越“落后”。比如我 1996 年在巴西出生的时候,就已经有实时结算系统了。虽然当时不便宜,但你是可以实时完成转账的。而现在已经 2026 年了,在美国,很多支付依然不是实时的。
为什么?因为巴西在 90 年代经历过恶性通胀,每月 30%。如果两天不到账,你的钱可能就贬值 5% 到 7%,所以整个国家对支付基础设施的投入是“生死攸关”的。而美国因为长期经济稳定、货币稳定,反而没有那么强的动力去升级这些系统。这也意味着在美国,其实有非常大的改造空间。
Pedro:比如在巴西,央行推出了一个叫 Pix 的系统,可以实现任意账户之间的实时转账,用手机号或税号就能转,非常方便。但巴西大概只有 30 家主要银行,而美国有几千家银行。你要推一个新系统,就得一家一家去接入。
所以即使像 RTP(实时支付)这种系统,大银行支持了,小银行和社区银行可能还没跟上。银行体系的“分散”,确实降低了创新速度。再加上巴西当年现金和线下交易占比很高,政府有很强动力去推动支付现代化,央行也做得很好。
Pedro:美国有一些“特殊性”。比如信用卡奖励体系非常成熟、很多支付仍然不是实时的,还有一些在巴西存在但美国没有的机制,比如应收账款的集中清算系统,可以让你用合同做抵押提前融资。这些差异都很大,但反过来说,这也意味着机会非常多。
Pedro:从历史来看,金融其实和其他行业没有本质区别,但它有两个特殊点。第一是规模,金融几乎嵌入了整个经济运行。比如今天的美国经济,虽然已经有很多创新,但仍然有 97% 的经济活动是基于传统企业卡运作的。这个数字非常夸张,也意味着还有巨大的增长空间。
当 Capital One 找到我们时,我们先做了一件很理性的推演:如果保持独立发展,5 到 10 年后 Brex 会变成什么样?如果和一家规模巨大的金融机构结合,又会怎样?
在我看来,Capital One 其实是全球最具技术前瞻性的银行之一。他们很早就意识到,可以用数据、机器学习和技术去彻底重塑信用卡业务,以及整个授信评估体系。
接下来我们思考的是:如果把我们的产品和技术,放到这样一个体量和平台之上,会发生什么?当这个思路真正“对上”之后,你就很难再忽视它了。
本质上,这是一个组合:用大型金融机构的规模、品牌和信用能力,叠加我们在技术和产品上的优势。那关键就变成:如何加速它的 adoption curve(采用曲线)?如果只是自己慢慢做,这个过程会很长;但如果放在一个国家级规模的平台上推进,就有机会产生“系统性影响”。也就是说,你不仅是在做一个产品,而是在改变大量企业的运行方式。
Pedro:是的,这种情况很常见。但有两点让我对 Capital One 印象很深。
第一是速度。从最初接触到签署协议,只用了 40 多天,他们的决策非常果断。第二是他们作为“创始人公司”的思维方式。他们内部有一个说法——“不要把蝴蝶压死”(don’t crush the butterfly)。意思是:你要利用大公司的规模优势,但同时保留 Brex 原本的活力和独特性。
他们的创始人 Rich 还有个比喻:我们不是要改变 Brex,而是“给这株植物浇水”。当然,银行的风险控制还是要做,但整体思路是尽可能轻量整合,保留 Brex 的动能,甚至加速它。我们相信,在未来 3 到 5 年里,这种组合能让公司比单独发展时大得多。
Pedro:我觉得可以从两个角度来看。
第一点是,我们在 2023 年意识到,公司当时的状态和今天完全不同,于是我们决定进行一次非常“激进”的调整。当时我们做了一件外界讨论很多的事——重置了内部估值。我们确实按 120 亿美元估值融资过,这是事实。但问题是,如何让员工在一个 50 亿美元的结果里,依然是“赢”的?
我们的做法是:重新定价所有员工的股权。我们和董事会沟通,把员工的期权价格调到了一个更现实的水平,这极大改变了团队的激励结构。与此同时,120 亿估值进来的投资人也通过优先权得到了保障。最终,这反而变成了一个对所有人都不错的结果。
但更关键的是,在大概三年前最困难的时候,我们选择直面现实。我常说一句话:“艰难的决定,带来轻松的人生;轻松的决定,带来艰难的人生。”我们当时做的“艰难决定”包括:裁掉接近 30% 的员工、重定股权、调整公司运作方式、内部大量晋升、砍掉两层管理层,并启动了一个我们内部称为“Brex 3.0”的重建过程。正是这些决策,让我们走到了今天。而且即便在签署收购协议之后,我们的增长还在加速。
所以我觉得更合理的理解方式是:两三年前,我们主动做了一系列选择,让这个结果对员工来说依然是“赢”的。因为我们接受了一个现实:无论你愿不愿意,一切最终都会向公开市场的定价收敛。如果今天这是一家上市公司,它应该值多少钱?我们强迫自己用这个视角来看问题,哪怕这很痛苦。因为 2021 年的那些“神话式估值”,本质上就是神话。
第二点是竞争。这个行业竞争激烈是必然的,它是美国经济非常核心的一部分。但有一个更重要的视角:我们,包括所有“新一代”的竞争者,目前只占美国市场份额的 3%。问题不是彼此之间怎么竞争,而是怎么去拿下剩下的 97%。
我们的判断是:如果想实现“两个数量级”的增长,和一家大型行业巨头合作,走的路径完全不同。当你看到规模差距时,这件事会变得非常直观。比如,Capital One 每年花 60 亿美元做营销,而我们只有它的 1%;他们每年 60 亿美元做研发,我们只有它的 2% 到 3%。当你把这种规模优势叠加到一个已经有效的产品上,它会产生巨大的加速效应。
所以对我们来说,核心问题是:如何拿下那 97% 的市场,并成为其中的绝对赢家。所有决策包括融资、结构、路径,都要围绕这个目标。
对我个人来说,我一直希望 Brex 能成为美国经济的重要组成部分,甚至在我离开之后依然长期存在。就像我十年前离开了巴西的第一家公司 Pagar.me,但它现在依然是当地第二或第三大的在线支付公司。我希望 Brex 也能做到这一点,而要实现这个目标,“规模”是绕不开的。
Pedro:两者都有。一方面,现在有了 AI,学习新东西的门槛比以往任何时候都低。如果我说,我想掌握某件事情,从理论上讲是可以做到的。但另一方面,真正有价值的机会,往往来自你过去探索过的领域。你对一个机会的“判断力”,也取决于你对这个领域的理解深度。
如果我们没有在巴西做过第一家公司,我们不可能做出 Brex。因为我们对支付行业太熟了,我们了解发卡、收单、商户端、风控、监管等等。这些经历,构成了下一件事发生的“条件”。
我很认同黄仁勋的一句话:与其去做你“热爱的事情”,不如学会“爱上你正在做的事情”。
因为当你在一个领域里建立起“掌控感”,你能理解每一层结构,能看到二阶效应、系统影响,你对这个世界的理解会完全不同。
比如我们现在做 AI agents,表面上看是成本降低、合规提升、自动化增强。但再往下看,你会发现:美国经济每年花 5000 万小时在做费用管理。那问题就变成:我们能不能用技术,把这 5000 万小时消掉?
于是你开始构建自动化 agent,优化流程,改变组织结构……从最初的企业卡,到今天的 AI 系统,中间其实跨越了七八层逻辑。而我们之所以能看到这条路径,是因为过去的经验。
所以我不会说,我“必须”一直做 fintech。但确实,你走到哪里,和你从哪里来,有很强的关联。我很感激这些经历,让我看到了这些问题,也有能力去解决它们。
Pedro:有可能。最近我其实对机器人领域很感兴趣,也一直在关注这个领域的前沿发展。当然,像 Tesla 的 Optimus 这样的项目很吸引人,但我也在留意一些更早期、更多靠自身力量推进的团队。
Pedro:目前主要是关注,也会做一些天使投资。这是过去三到六个月才开始的一个新兴趣。但我现在真正花时间最多的是另一件事,我对虚拟员工特别着迷。我在研究:如何在公司内部部署 AI 员工,让他们看起来、行动起来都像真实员工:有名字、有 Slack 账号、有邮箱,会参与会议、和人协作。过去三个月我对 OpenClaw 特别上头,甚至把我自己的很多生活都自动化了。
Pedro:有的。
Pedro:两者的职责其实是刻意错开的,重叠并不多。我的真人助理非常优秀,所以我不认为是在竞争。
我更想从“我们是怎么走到这里的”这个角度来讲。在我看来,Opus 4.5 已经是 AGI,或者至少已经非常接近 AGI;而 Opus 4.6,则是在把那些还略显粗糙的边角进一步打磨完善。
我通常用一个比喻来理解这一切:就像电力是在 12 月被发明的,而现在是 3 月。问题变成了,既然有了“电”,你现在到底能用它造出什么?这才是关键。
虽然编程模型很引人注目,你也能看到 claude code 以及各种 agent harness 在快速演进,但我认为真正被解锁的、最有意思的能力,其实是模型的 self-bootstrap(自我构建能力)。
我们在 Brex 内部做过一个实验:用 OpenClaw 创造“虚拟员工”。比如,我们做了一个名叫 Jim 的虚拟招聘专员。Jim 本质上就是一个存在于 Slack 里的“人”——他有自己的邮箱,也会和公司内部的招聘人员沟通交流。
真正的挑战是:如何在不写一行代码的前提下,把 Jim 构建出来。
当然,早期版本里仍然有一些具备技术背景的人参与。但真正有意思的是,你会看到招聘人员直接和 Jim 对话。比如,有人会跟 Jim 说:“我怀疑这份简历有造假,你能帮我看一下吗?”
这个 agent 不只是回答问题,它会直接生成一整套能力:自动筛选简历,并判断其中是否存在造假。更重要的是,这一切从来不是靠人为写代码去实现的。在我看来,这才是我们此前所缺失的关键跃迁。
现在我们花了很多时间在思考的是:如何在 Brex 内部安全地部署这些能力。因为行业现在的一个共识是,模型不可预测、不够安全,所以不敢在关键环境里使用 OpenClaw 这样的系统。而我们的选择是:那就去解决“安全”这个问题,然后真的在内部把这些东西部署起来,利用这项技术,看看它真正的边界到底在哪里?
我们其实已经构建了一整套技术体系,而且我们接下来也打算把它开源。我们把它叫做 Crab Trap,这个名字还挺好玩的,它背后的核心思路是:当你有一个像 OpenClaw 这样的 agent 在运行时,最好的监控方式不是让人类盯着,而是让另一个 LLM 来盯。
我们构建了这样一套系统:它实际上会拦截一个 OpenClaw 实例发出的所有流量,然后通过一个 HTTP 代理,把这些流量路由到另一个 LLM,由后者对所有流量进行审查,并判断:这是不是一个招聘 agent 应该做的事?
举个例子,一个招聘 agent 是否应该向候选人发送一条带有伤害性的信息?当然不应该。于是,这套系统就可以直接在网络层拦截并阻止这类请求,而 agent 本身甚至都不知道这件事正在发生。
而这里真正很酷的一点在于,这种机制其实是可以大规模运行的。我们认为,未来唯一能够有效监控 agents 的技术,实际上就是 agents 自己。于是你就形成了一种“对抗式结构”:一个 agent 监督另一个 agent。目前来看,这种方式的效果出乎意料地好。
当然,这并不意味着我们已经把 OpenClaw 的虚拟员工部署到公司最核心的工作流里,我们只是在部分场景中尝试。但真正有意思的地方在于,我们没有因为前沿模型的安全问题尚未完全解决,就选择暂缓部署。我们的态度是:与其因为安全问题停下来,不如直接把安全问题解决掉。因为这本质上并不是模型能力的问题,而是一个系统问题,更具体地说,是一个分布式系统层面的工程问题。
一旦把这个问题处理好,LLM 本身的能力、以及当前最先进模型所展现出来的水平,其实已经强大得惊人。换句话说,真正阻碍部署的,更多是外围系统与安全机制,而不是模型本身。所以,对我们来说,这一点特别令人兴奋。
Pedro:不完全是。我们在很多不同场景中使用 OpenClaw,虚拟员工只是其中之一。另一个层面是,我个人现在几乎用它来处理所有事情。某种意义上说,我现在几乎是通过 OpenClaw 在运营 Brex。
我觉得,现在市面上有很多 AI 生产力工具,但它们普遍忽略了一件事:现实世界其实是一个噪音极大的环境。在 Brex,我要面对成千上万个 Slack 频道、上千名员工,以及每天数百封邮件。真正困难的,不是有没有信息,而是:哪些信息值得关注?
所以我给自己搭了一套“自动驾驶”系统,它的底层是一个信号摄取 / 注入管道。这套系统会扫描我的邮箱、Slack、Google Docs、WhatsApp 以及其他多个数据源。
但更关键的是,我把这套自动化系统建立在两个核心对象之上:人和项目。
所谓“项目”,可以理解为我希望持续获得更新的重要事项。比如公司的财务表现、与 Capital One 的整合、内部 AI 战略等。对于每个项目,我都会明确告诉系统:我关心什么,不关心什么。于是,系统就会在这些项目的上下文中筛选信号,并把其中值得我知道的互动、动态和行动项整理出来。
“人”也是同样的逻辑。我会明确声明,哪些人是我关心的对象——公司里以及我更广泛生活中,大概有 25 人左右。然后,我再告诉系统:关于这些人,我真正关心的是什么。接着,系统就会以这些人为过滤视角,对所有信号进行处理。
最终,它会生成一份非常清晰的摘要,告诉我:公司里有哪些事情值得我关注,以及我有哪些待办事项。
而更进一步的是,我还做了一个叫 autoresolver 的模块。它会查看我的待办清单,并根据会议、邮件或聊天的上下文,判断如何自动推进这些任务。
比如,假设我在一次会议里说:“这件事我们之后应该跟进一下。”如果 Granola 正在记录这场会议,那么它就会把这段内容送进信号管道,生成一个行动项。随后,autoresolver 会读取会议记录,判断最合适的后续动作是什么:给对方发短信、发 Slack,还是发邮件。它甚至能自动起草这条消息,而我只需要点击确认。
所以,整套系统其实就是由很多可组合的能力模块构成的。你可以把这些模块像乐高一样拼接起来,去完成非常复杂的工作流。我现在实际上已经在用 OpenClaw 运行这套系统,把 CEO 这份工作的核心流程拆解成:接收信号、判断重点、汇总摘要、生成任务、推动执行、跟进结果,它甚至还能自动替我做 follow-up。
我还可以继续往里添加新的“技能”。比如,我做过一个技能,叫 “以 Pedro 的方式审阅文档”。因为无论我是在看文档、做产品评审,还是看一份演示材料,我反复都会问那几类问题:最关键目标是什么?为什么选这个目标?现在最大的瓶颈是什么?为什么进展还不够快?这类问题完全可以被抽象成一个技能模块,并接入整条系统管道中。
归根结底,这就像一套可自由拼装的乐高积木。通过这些模块,你可以构建出极其复杂的系统。而我现在做的,实际上已经是一整套面向 CEO,或者更广义地说,面向信息密集型组织管理者的工作流系统。我之后大概率会把它开源。
Pedro:对,完全是。我会把它称为一种“AI 式精神入迷”。
我们家里现在有一条规矩,叫做“周六禁止 AI”。我太太会这么说,是因为我几乎一直都在跟我的 OpenClaw 说话,老是在给它发语音消息。
而且这真的是我体验过最好的开发方式。比如我来这里的路上,就正好在处理数据管道里的一个同步问题。我 literally 一路都在发语音消息:“嘿,把这个改一下,把那个改一下,做这个,做那个。”这真的很惊人。哪怕我人在车上、正在来这里的路上,也能切换到一种工作模式,把一大堆事情推进下去。
但问题在于,这实在太容易了,于是你就会开始无时无刻都在做这件事。比如我可能正在吃晚饭,还在发语音消息,我太太就会说:“停,先吃饭。”所以我们后来就定了规矩:周六不碰 AI,家里也不聊 AI。某种意义上,这还成了一个挺有趣的日子。
Pedro:支付方式的演进当然会继续,但这在我看来其实没那么有意思。真正让我觉得兴奋的,是“花钱”这个决策本身。我深信一个理念:无论是公司还是个人,你最终会变成你所投资的样子。你的资源配置、你招的人、你做的决定、你用的技术,定义了你是谁。有一句我很喜欢的名言:“我们塑造了工具,尔后工具又反过来塑造了我们。”
我认为未来公司做财务决策的思维维度会发生质变。现在很多决策难点在于缺乏上下文,或者说信息过于碎片化。想象一下,未来你可以瞬间聚合所有信息,并清晰地预判:这项决策不仅会对营收和成本产生什么影响,它会如何投射到公司文化、愿景和使命上?这些宏大的东西最终会层层传递到每个员工再普通不过的周三。
人生是一幅宏大的画卷,但你其实生活在其中的一个像素点上。说到底,愿景谈得再多,最终也要在每日的工作中落实。当公司拥有某种“自动驾驶”能力来辅助决策时,它会从根本上改变资本流动的逻辑,让每一分钱的去向都与公司和个人的核心价值真正对齐。
我觉得无论是对公司还是个人,这都将是一个巨大的 unlock。当然,AI 会是核心驱动力,各种支付技术、Agentic Payments、Agentic Commerce 等等都会各司其职。但说到底,什么才是“蛋糕”本身,什么又是“蛋糕上的糖霜”?
在我看来,真正的“蛋糕”是:当你拥有了如此丰富的上下文之后,你在财务决策中所能拥有的判断质量、决策能力和分辨力会被大幅提升。想象一下:你身边时刻坐着全球最顶尖的 CFO 帮你做每一项决策,有全球最棒的创始人帮你权衡招聘,有最专业的人告诉你下一步该去哪儿扩张、如何增长、怎么拆解你的 Unit Economics。我觉得在未来几年内,这都会变成现实。
Pedro:这正是最迷人的地方。比如我们正在构建的招聘智能体,由于这些模型经过了大量的后训练,它们对“什么才是优秀候选人”往往有着非常趋同、标准化的看法。但问题来了:对“我们”公司来说,什么才是优秀的候选人?我认为,焦点和约束才是让选择产生意义的关键。所以,当你去问一个招聘人员:这个人最需要在哪些维度上特别突出?我们到底要围绕什么去招?——这就比那种“他是不是没有明显短板”的思路要深得多。后者恰恰是模型最容易泛化、也最容易滑向的方向。通常来说,要让模型明确地说“不”,其实是很难的。
这是一个非常深刻的启示:真正的难题在于判断哪里需要 Spikiness(这种极端突出的特长)。这种关于“你想构建什么样的公司”的判断力,本质上是人类的决策,是你赋予公司的独特风味。就像我们的挑战在于:如何给 AI 注入一种 Brexiness(Brex 公司的独特气质)?
Pedro:完全正确。比如我们很看重的一个特质是——当然我在这点上有偏好——一个人是否曾在人生的某个阶段,做过一件事,而驱动他的唯一原因,只是单纯地热爱这件事本身。
比如那些在高中就开始写代码的人,他们没什么功利的目的,顶多是为了申请大学,但你能从他们做的东西、从他们与这门手艺的关系中感受到那种纯粹。或者原本在金融行业工作的人,突然深潜到 AI 领域,用 Claude Code 搞出了一个庞大的自动化系统,他本不必这么做,但他做了,这种驱动力非常纯粹。我们希望教会我们的招聘人员去识别这一点。但这只是我们的标准,并不适用于每家公司。
能够理解并区分你对某个职位的 Ethos(特质 / 精神)与 Technical Excellence(技术卓越),这一点至关重要。因为技术上的卓越在未来将是标准配置,而 Ethos 才是选择。你无法简单论证“招一个从小自学代码的人”和“招一个在 OpenAI 或 Anthropic 做研究的机器学习博士”哪个更好,这完全取决于你想构建什么样的公司。
如果把非核心的杂事都交给模型,剩下的这些需要极高洞察力的问题,才是人们真正应该投入精力的地方。
Pedro:我有一个 autopilot UI,里面基本上包含了我所有的任务,以及整个系统的状态。它其实就是一个小型的 web 界面。
Pedro:不,更像是一个网站——背后有一个 server 在运行。然后我平时通过 Telegram 跟它对话,也会用 Discord 来做多频道管理,以及 sub-agent 之间的协调之类的事情。
Pedro:对,我就会直接发语音消息给它。
Pedro:它也可以。事实上,它已经接入了一个能力——这也是我们很快会在 Brex 上推出的——它可以通过一个 MCP,访问在 Brex 上创建虚拟卡的能力。这样一来,它就能自己去网站上操作,填入一张信用卡,回来跟你说:“好了,已经搞定了。”这个 agent 可以自己把这件事做完。
Pedro:绝对不可能。一方面 IRS 也会替你做报税这件事,另一方面 AI 也可以帮你完成这件事。这种情况其实某种程度上可能已经开始发生了。只不过我常常跟别人说:未来每个人都会被审计,因为审计的成本会变成零。那会是个很有意思的未来。
Pedro:有意思的是,这其实本质上是不同的问题。几乎可以说,一边是报税软件,另一边是记账这份工作本身。记账工作的其中一部分,当然是和报税软件打交道;但另一部分,则是去收集文档、向你询问某些具体的支出和交易,确认它们到底是什么、又不是什么。
所以,真正有意思的其实是记账这项工作最终会逐渐成为软件本身的一部分。
Pedro:我觉得是这样。我的一个基本判断是:以会计这个领域为例,我认为未来你可能依然会需要一个记账人员,因为你还是需要 CPA 来替你报税,这是法律要求。也就是说,如果你替别人申报税务,你就必须是一个注册会计师。
而这个体系很巧妙的一点在于:如果你的税务出了问题,CPA 本人要承担一定程度的个人责任。这就在系统里形成了一种非常好的反向压力。因为既然有人要对结果承担个人责任,那他就一定会确保数据是正确的,也一定会确保自己使用的工具,在准确性和可控性上都达到了足够高的标准。
所以我其实觉得,这套机制非常重要。哪怕未来真的出现像 Harvey 这样的系统,或者出现非常强大的 agentic AI 律所,能够把大量法律工作做得非常出色,最后仍然需要一个人类在末端把关。
我们经常讨论一个问题:如果 Jim(前文提到的虚拟招聘专员) 在招聘中犯了一个非常严重的错误,那你该追究谁的责任?是追究 Jim,还是追究某个员工?答案其实是:你需要为 agent 建立和员工一样的监督机制。
所以 Jim 也有经理。招聘团队里确实有人是 Jim 的上级经理,要为 Jim 的所有行为签字批准。
Pedro:对,完全一样。还要给它反馈,对吧?给它工具权限、给它预算、建立反馈机制,并确保这些反馈真的会被纳入系统里;如果出了问题,你还得“解雇”Jim,或者替换掉它。
当然,“解雇”更多只是个比喻。但归根结底,我觉得这里最有意思的问题是:如何对 agent 建立监督,以及如何让人类真正安心地接受:有 agent 正在代表自己行动。
Pedro:是通过 OpenClaw,再配合一张 Brex 卡。
Pedro:也没有特别频繁。我大概一周会这么做一次。虽然我自己平均每两三天就会有一次网购,所以大概可以说,三分之一左右的情况我会这么做。不过我也在有意识地推动边界,看看它到底能做到什么程度。
有一个很有意思的例子:有一次我们有几个朋友要去看电影,他们把自己的座位发给了我们。然后我 literally 就把那条消息转发给我的 OpenClaw,说:“买附近的票。”
接着,它就自己上网,打开电影院的网站,找到那场电影、那个影厅、那个时间,再定位朋友们的票对应的座位。然后它告诉我:“这两个位置已经被占了,你应该选旁边这两个。”我说:“好。”然后它就继续在线操作,填入卡信息、完成支付,事情就结束了。接着我收到一封邮件确认,而我自己什么都没干。
Pedro:有,名字还挺有意思的。我叫它 Lemon Pie。这名字有点奇怪,因为我 12 岁的时候,做的第一个 bot 就叫 Lemon Pie——因为柠檬派是我最喜欢的甜点。后来我人生里做的各种 bot,基本都叫 Lemon Pie。所以我就想,好吧,这个系统也必须叫 Lemon Pie。算是一个挺好笑的历史遗留吧。
Ashlee:好吧,我想要你这个系统。我很期待你把这些东西做出来,让我们也都能用上。非常感谢你今天过来。
访谈视频原链接:
https://www.youtube.com/watch?v=9ZbbxSgrjhw
声明:本文为 InfoQ 编译,不代表平台观点,未经许可禁止转载。

世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?安全与可信这道坎怎么过?研发体系不重构,还能撑多久?
AICon 上海站 2026,4 大核心专题等你来:世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构。14 个专题全面开放征稿。
诚挚邀请你登台分享实战经验。AICon 2026,期待与你同行。
今日荐文
“如果你不用更多Token,就永远逃不出底层”:AI竞赛开始变成资源战争
“我可能不再建议学计算机”!图灵奖得主炮轰半个行业,并断言:AI Agent最后全是数据库问题
15小时3.5万Star!Altman投资的AI终端开源炸圈:曾经没人用,如今靠Agent翻身

夜雨聆风