“搜索是通往信息世界的入口;如果它能接近完美,会对整个世界产生巨大的下游影响。”
“Agent 不想只拿到 10 条结果,它想要的是尽可能完整的信息。”
“Google 积累的人类点击数据,对服务 Agent 这件事并没有那么重要。”
本期对话的嘉宾是 Exa 联合创始人兼 CEO Will Bryk,主持人为 a16z 的 Sarah Wang。Bryk 长期痴迷于“如何找到最高质量知识”这件事,甚至把它描述成自己的“人生使命”。在他看来,搜索从来不是一个已经完成的行业,相反,当用户从人类变成 AI Agent,搜索才第一次真正暴露出自己的结构性短板。
这期内容最有价值的地方,不在于“Exa 是一家做搜索的公司”这层表面信息,而在于 Bryk 把一个常被忽略的事实说得很透:过去二十年互联网搜索的默认目标,是帮普通人更快拿到一个足够好的答案;而接下来的十年,搜索会越来越像软件基础设施,服务对象将从“点击网页的人”,变成“需要持续调用外部世界知识来执行任务的系统”。如果这个判断成立,那么搜索的评估指标、技术路线、商业模式,甚至它和内容提供方的关系,都要被重新定义。
Google 不是不够强,而是它的优化目标从一开始就不同
Bryk 对 Google 的判断其实非常克制。他并不认为 Google 失败,恰恰相反,他明确承认 Google 在其目标函数下几乎是奇迹般成功的产品:面对数十亿普通用户,用极少关键词猜中意图、给出快速回答、让绝大多数人满意。这是一套围绕“消费者检索”建立起来的庞大系统,它天然偏向高频、通用、点击驱动的问题。
但他指出,一旦问题从“我想快速知道答案”变成“我想真正理解一个复杂主题”,Google 的默认范式就会暴露局限。Bryk举的例子很生动:如果你只是想知道某个常识性问题,Google 很好用;可如果你想深入理解一个历史时期的真实生活状态,或者想系统搜集一家公司的全部潜在竞争对手,信息并非不存在,而是分散在互联网各处,且需要更深层的检索与组织能力。这时,传统搜索擅长的“表层可得性”就不等于“结构化理解”。
也因此,他把 Exa 的机会定义为:不是去替代 Google 的大众入口地位,而是去服务那些“深查询”“复杂查询”“高价值查询”。这包括研究、招聘、投研、竞争情报、技术检索等场景。换句话说,Google 的问题不是太弱,而是太成功地服务了另一类需求,以至于它未必愿意、也未必适合为这些更深的任务彻底重构自己。
AI Agent 改写了搜索需求:它不要前十条结果,它要接近完整
这期对话最核心的判断,是“Agent 搜索”和“人类搜索”在需求层面根本不是一个东西。Bryk 反复强调,人类往往只需要前几条结果里一个还不错的答案,但 Agent 的目标不是“浏览”,而是“完成任务”。既然是任务导向,它就不能只满足于十条蓝链,而是要拿到更全面、更高覆盖率、更可组合的信息集合。
他用了投资场景来解释这一点:如果一个 Agent 在帮助投资人研究一家生物科技公司,那么它最怕的不是速度慢一点,而是遗漏了关键事实。少看一家竞品、漏掉一个信号、忽视一条重要资料,都会直接影响判断质量。对人类来说,检索结果不完整也许只是“不够方便”;对 Agent 来说,这可能意味着后续推理与执行全部建立在缺损的数据地基上。
因此,Bryk 认为新一代搜索不该只是返回“10 个最相关结果”,而应该支持 1,000 甚至 10,000 条结果规模的高质量召回,并允许系统按任务需求继续筛、排、抽取、验证。这里的关键变化在于:搜索的价值从“替人做第一次选择”,变成“给机器提供尽可能完整的可操作世界模型”。一旦你接受这个前提,就会明白为什么 Agent 时代的搜索架构必须和传统网页搜索分道扬镳。
LLM 不是搜索的替代者,反而让重做搜索第一次变得可行
外界常把 LLM 看成“搜索的替代品”,但 Bryk 的观点几乎相反:正是 Transformer 和后来的 LLM 能力提升,才第一次让一个小团队有机会在很多维度上做出比 Google 更好的搜索体验。
他解释说,过去搜索引擎很多复杂能力——尤其是重排、理解复杂查询、做语义匹配——往往需要极其庞大的工程团队和长期累积。而现在,LLM 让一部分曾经高度昂贵的能力被“软件化”了。以 reranking 为例,过去可能要庞大团队不断调系统,现在则可以先用模型能力跨过一个巨大门槛,再在此基础上继续训练更快、更专门化的模型。也就是说,LLM 并没有消灭搜索,反而降低了“把搜索做得更聪明”的门槛。
但 Bryk 也没有把事情说得过于轻松。他提到,面向 Agent 做搜索,一方面“更容易”,因为你不再那么依赖 Google 那种海量人类点击数据;另一方面也“更难”,因为客户要求的正确率和完备度远高于传统消费场景。过去 99.9% 的质量可能已足够好,现在很多企业任务要的却是 99.99%、99.999% 级别的可靠性。LLM 带来的不是终局,而是把竞争焦点从“谁先做出来”升级成“谁能把召回、排序、抽取、延迟、成本和正确率同时打磨到企业可用”。
人类点击数据不再是决定性护城河,搜索竞争回到了检索本身
这期内容里一个非常重要、但也很容易被低估的点,是 Bryk 对 Google 传统护城河的重估。他认为,Google 多年积累的人类点击数据,对服务人类用户确实极其关键,因为那套系统本来就是围绕“人会点什么”“人觉得什么有用”建立起来的。但当服务对象变成 Agent,这种优势并不会原样迁移。
原因很简单:Agent 并不以“点击”作为主要交互单位。它关心的是任务成败、信息覆盖率、后续推理质量、能否把检索内容嵌入更长链路的执行流程。人类点击信号当然仍有参考价值,但它只是弱信号,而非决定性信号。真正重要的,反而变成了更好的语义检索、更完整的数据索引、更灵活的结果规模、更低延迟下的更高质量提取,以及围绕不同任务做出的定制化能力。
这也解释了为什么 Bryk 认为,小团队也有可能在某些方向上建立明显优势。旧时代搜索的壁垒是“流量 + 点击 + 广告循环”,新时代更像“索引 + 检索 +模型 + 场景反馈”的复合壁垒。护城河没有消失,只是换了位置。谁更接近任务真相,谁就更可能成为 Agent 时代的默认检索层。
编码 Agent 会率先受益,因为最新文档与高质量检索直接决定输出质量
当 Sarah Wang 把问题转向 coding agents 时,Bryk 的回答也很有启发。他认为,代码场景之所以关键,不只是因为 AI 编程火,而是因为它天然暴露了检索质量的重要性。写代码本质上就是不断访问外部知识:最新文档、SDK 说明、最佳实践、接口变化、兼容性约束、示例代码、社区经验。没有稳定检索,模型再聪明,也很容易在“接近正确”的地方踩坑。
他特别提到,当前很多 coding agents 在智能性上已经非常强,但在检索质量上仍像停留在“搜索的早期时代”。这意味着模型会推理,却未必总能拿到最新、最准、最完整的上下文。一旦你把高质量检索接进来,收益并不是让回答更花哨,而是让错误显著减少,让生成代码更贴近真实环境。Bryk 举了 Devin 等产品接入 Exa 后效果提升的例子,核心意思很明确:编程 Agent 的真实上限,并不只由模型参数决定,也由它获取世界知识的能力决定。
从更长远看,他甚至判断 coding agent 和 general agent 之间的边界会逐渐消失。因为无论是写代码、做研究、还是处理工作流,本质都是“理解任务—检索信息—执行动作—校验结果”。只要这条链路成立,搜索就不会是边缘能力,而会是每一个高质量 Agent 的心脏部件。
Exa 想做的不只是搜索框,而是 Agent 经济中的信息基础设施
对话进入后半段后,Bryk 的野心变得更清楚:他并不把搜索理解为一个单点工具,而把它看成整个 agentic economy 的底层设施。他的一个关键预测是,到了 2030 年前后,agentic search 的总体规模可能会超过 Google Search today 的商业体量。这个判断听上去激进,但他给出的逻辑并不复杂:当每个人都有个人 Agent、每个软件都持续用检索来校验和补全自己时,搜索调用量将不是“比今天多一点”,而可能是数量级地上升。
他用一个很强的比喻来描述未来:未来的搜索之于软件世界,可能会像电力之于现代社会——不再总被用户直接感知,却会成为每个系统背后的基础供应。今天人类用户平均每天只做少量搜索,但一旦软件开始替用户持续检索、核验、发现、比对、监控,整个世界会被无数次机器检索填满。那时搜索不再是“打开网页前的入口”,而是嵌入工作流内部的持续过程。
这个视角也让 Exa 的定位变得更像云服务或支付网络,而不是一个新的门户网站。它要解决的不只是“搜到什么”,而是“怎样以合理成本、足够覆盖、足够快、足够准的方式,把外部世界稳定接入软件系统”。如果这个方向成立,那么搜索公司的产品边界、定价逻辑和客户结构,都会更接近基础设施公司,而不再只是消费互联网产品。
内容提供方不会消失,但搜索与内容之间的利益分配必须重写
这期对话里另一个值得重视的部分,是 Bryk 对内容提供方和封闭网络的看法。面对“网站不愿被 AI 抽干价值、内容平台越来越封闭”的担忧,他并没有回避,而是明确承认这是当前搜索基础设施必须面对的现实摩擦。
不过,他给出的思路并不是简单站在“抓取方”或“内容方”任何一边,而是提出一个更大的设想:如果 agentic economy 的总价值真的会远超今天的互联网广告体系,那么完全有可能重新设计一套分配机制,让内容提供者在新体系中拿到比过去更多的收入,而不是更少。换句话说,问题不该只是“AI 会不会吃掉流量”,而是“当机器成为主要信息消费者时,价值如何被重新结算”。
这当然还不是今天已经解决的问题,但它提醒我们:AI 搜索的未来,不只是一个技术问题,也是一个制度与商业结构问题。谁拥有数据、谁能访问数据、谁从检索中获益、谁承担内容生产成本,这些都决定了完美搜索是否真的有可能接近现实。Bryk 的乐观在于,他相信新经济体足够大,大到能容纳比“广告平台独占大头”更好的分配方式。
真正的瓶颈还没到模型,而会依次落在基础设施、数据与更大规模检索上
如果说这期对话有什么最“基础设施视角”的部分,那就是 Bryk 对未来瓶颈的判断。他认为,短期内限制 agentic search 发展的,首先不是模型智能,而是承载海量检索请求的基础设施。假如搜索请求量变成 Google 时代的 10 倍、100 倍、1000 倍,那么向量数据库吞吐、索引更新、系统成本、端到端延迟,都会成为真正的硬问题。
中期看,瓶颈会转向数据。因为 Agent 想理解的并不只是网页,而是整个世界:公开网页、未充分结构化的数据、组织内部知识、图像、卫星信息、人的经验、尚未被记录的事实。也就是说,搜索的上限最终取决于“世界信息被索引到什么程度”。当可检索对象从“网页”扩展到“世界”,搜索公司面对的就不再只是爬虫和排序,而是知识采集、异构数据整合与权限治理。
而在更长期,瓶颈又会重新回到检索算法本身。Bryk 提出一个很有画面感的问题:如果今天的网络规模已经极大,那么当可搜索对象再膨胀一千倍时,现有算法还能以可接受成本工作吗?如果答案是否定的,那么真正的创新并不只在模型,而在如何让“海量数据上的高质量检索”继续保持可扩展、可负担、可商用。这个问题,很可能正是未来十年搜索基础设施最硬核的战场。
结语
这场对话最值得记住的一点,不是 Exa 是否能成为下一个巨头,而是它帮我们重新理解了“搜索”这件事。过去我们把搜索看成网页入口,把它和浏览器、广告、关键词、点击联系在一起;但在 AI Agent 时代,搜索更像一种持续运行的信息供给系统。它服务的对象,不再只是一个敲关键词的人,而是一个要代表人类行动、判断、验证、执行的软件体。
也因此,未来最重要的搜索引擎,未必是“最会给人看结果”的那个,而可能是“最能给机器提供完整、可靠、可操作信息”的那个。对 Exa 来说,这是一条极其艰难、却也极具时代性的路;对整个 AI 产业来说,这期对话则提醒我们:当所有人都在讨论模型时,真正决定 Agent 上限的,也许是模型背后那层被低估的检索基础设施。
内容来源:How Exa is Building the Perfect Search Engine | Deep Dives with a16z丨a16z Deep Dives
夜雨聆风