搜索不再服务人:Exa 如何为 AI Agent 重造搜索引擎

“搜索是通往信息世界的入口；如果它能接近完美，会对整个世界产生巨大的下游影响。”

“Agent 不想只拿到 10 条结果，它想要的是尽可能完整的信息。”

“Google 积累的人类点击数据，对服务 Agent 这件事并没有那么重要。”

本期对话的嘉宾是 Exa 联合创始人兼 CEO Will Bryk，主持人为 a16z 的 Sarah Wang。Bryk 长期痴迷于“如何找到最高质量知识”这件事，甚至把它描述成自己的“人生使命”。在他看来，搜索从来不是一个已经完成的行业，相反，当用户从人类变成 AI Agent，搜索才第一次真正暴露出自己的结构性短板。

这期内容最有价值的地方，不在于“Exa 是一家做搜索的公司”这层表面信息，而在于 Bryk 把一个常被忽略的事实说得很透：过去二十年互联网搜索的默认目标，是帮普通人更快拿到一个足够好的答案；而接下来的十年，搜索会越来越像软件基础设施，服务对象将从“点击网页的人”，变成“需要持续调用外部世界知识来执行任务的系统”。如果这个判断成立，那么搜索的评估指标、技术路线、商业模式，甚至它和内容提供方的关系，都要被重新定义。

Google 不是不够强，而是它的优化目标从一开始就不同

Bryk 对 Google 的判断其实非常克制。他并不认为 Google 失败，恰恰相反，他明确承认 Google 在其目标函数下几乎是奇迹般成功的产品：面对数十亿普通用户，用极少关键词猜中意图、给出快速回答、让绝大多数人满意。这是一套围绕“消费者检索”建立起来的庞大系统，它天然偏向高频、通用、点击驱动的问题。

但他指出，一旦问题从“我想快速知道答案”变成“我想真正理解一个复杂主题”，Google 的默认范式就会暴露局限。Bryk举的例子很生动：如果你只是想知道某个常识性问题，Google 很好用；可如果你想深入理解一个历史时期的真实生活状态，或者想系统搜集一家公司的全部潜在竞争对手，信息并非不存在，而是分散在互联网各处，且需要更深层的检索与组织能力。这时，传统搜索擅长的“表层可得性”就不等于“结构化理解”。

也因此，他把 Exa 的机会定义为：不是去替代 Google 的大众入口地位，而是去服务那些“深查询”“复杂查询”“高价值查询”。这包括研究、招聘、投研、竞争情报、技术检索等场景。换句话说，Google 的问题不是太弱，而是太成功地服务了另一类需求，以至于它未必愿意、也未必适合为这些更深的任务彻底重构自己。

AI Agent 改写了搜索需求：它不要前十条结果，它要接近完整

这期对话最核心的判断，是“Agent 搜索”和“人类搜索”在需求层面根本不是一个东西。Bryk 反复强调，人类往往只需要前几条结果里一个还不错的答案，但 Agent 的目标不是“浏览”，而是“完成任务”。既然是任务导向，它就不能只满足于十条蓝链，而是要拿到更全面、更高覆盖率、更可组合的信息集合。

他用了投资场景来解释这一点：如果一个 Agent 在帮助投资人研究一家生物科技公司，那么它最怕的不是速度慢一点，而是遗漏了关键事实。少看一家竞品、漏掉一个信号、忽视一条重要资料，都会直接影响判断质量。对人类来说，检索结果不完整也许只是“不够方便”；对 Agent 来说，这可能意味着后续推理与执行全部建立在缺损的数据地基上。

因此，Bryk 认为新一代搜索不该只是返回“10 个最相关结果”，而应该支持 1,000 甚至 10,000 条结果规模的高质量召回，并允许系统按任务需求继续筛、排、抽取、验证。这里的关键变化在于：搜索的价值从“替人做第一次选择”，变成“给机器提供尽可能完整的可操作世界模型”。一旦你接受这个前提，就会明白为什么 Agent 时代的搜索架构必须和传统网页搜索分道扬镳。

LLM 不是搜索的替代者，反而让重做搜索第一次变得可行

外界常把 LLM 看成“搜索的替代品”，但 Bryk 的观点几乎相反：正是 Transformer 和后来的 LLM 能力提升，才第一次让一个小团队有机会在很多维度上做出比 Google 更好的搜索体验。

他解释说，过去搜索引擎很多复杂能力——尤其是重排、理解复杂查询、做语义匹配——往往需要极其庞大的工程团队和长期累积。而现在，LLM 让一部分曾经高度昂贵的能力被“软件化”了。以 reranking 为例，过去可能要庞大团队不断调系统，现在则可以先用模型能力跨过一个巨大门槛，再在此基础上继续训练更快、更专门化的模型。也就是说，LLM 并没有消灭搜索，反而降低了“把搜索做得更聪明”的门槛。

但 Bryk 也没有把事情说得过于轻松。他提到，面向 Agent 做搜索，一方面“更容易”，因为你不再那么依赖 Google 那种海量人类点击数据；另一方面也“更难”，因为客户要求的正确率和完备度远高于传统消费场景。过去 99.9% 的质量可能已足够好，现在很多企业任务要的却是 99.99%、99.999% 级别的可靠性。LLM 带来的不是终局，而是把竞争焦点从“谁先做出来”升级成“谁能把召回、排序、抽取、延迟、成本和正确率同时打磨到企业可用”。

人类点击数据不再是决定性护城河，搜索竞争回到了检索本身

这期内容里一个非常重要、但也很容易被低估的点，是 Bryk 对 Google 传统护城河的重估。他认为，Google 多年积累的人类点击数据，对服务人类用户确实极其关键，因为那套系统本来就是围绕“人会点什么”“人觉得什么有用”建立起来的。但当服务对象变成 Agent，这种优势并不会原样迁移。

原因很简单：Agent 并不以“点击”作为主要交互单位。它关心的是任务成败、信息覆盖率、后续推理质量、能否把检索内容嵌入更长链路的执行流程。人类点击信号当然仍有参考价值，但它只是弱信号，而非决定性信号。真正重要的，反而变成了更好的语义检索、更完整的数据索引、更灵活的结果规模、更低延迟下的更高质量提取，以及围绕不同任务做出的定制化能力。

这也解释了为什么 Bryk 认为，小团队也有可能在某些方向上建立明显优势。旧时代搜索的壁垒是“流量 + 点击 + 广告循环”，新时代更像“索引 + 检索 +模型 + 场景反馈”的复合壁垒。护城河没有消失，只是换了位置。谁更接近任务真相，谁就更可能成为 Agent 时代的默认检索层。

编码 Agent 会率先受益，因为最新文档与高质量检索直接决定输出质量

当 Sarah Wang 把问题转向 coding agents 时，Bryk 的回答也很有启发。他认为，代码场景之所以关键，不只是因为 AI 编程火，而是因为它天然暴露了检索质量的重要性。写代码本质上就是不断访问外部知识：最新文档、SDK 说明、最佳实践、接口变化、兼容性约束、示例代码、社区经验。没有稳定检索，模型再聪明，也很容易在“接近正确”的地方踩坑。

他特别提到，当前很多 coding agents 在智能性上已经非常强，但在检索质量上仍像停留在“搜索的早期时代”。这意味着模型会推理，却未必总能拿到最新、最准、最完整的上下文。一旦你把高质量检索接进来，收益并不是让回答更花哨，而是让错误显著减少，让生成代码更贴近真实环境。Bryk 举了 Devin 等产品接入 Exa 后效果提升的例子，核心意思很明确：编程 Agent 的真实上限，并不只由模型参数决定，也由它获取世界知识的能力决定。

从更长远看，他甚至判断 coding agent 和 general agent 之间的边界会逐渐消失。因为无论是写代码、做研究、还是处理工作流，本质都是“理解任务—检索信息—执行动作—校验结果”。只要这条链路成立，搜索就不会是边缘能力，而会是每一个高质量 Agent 的心脏部件。

Exa 想做的不只是搜索框，而是 Agent 经济中的信息基础设施

对话进入后半段后，Bryk 的野心变得更清楚：他并不把搜索理解为一个单点工具，而把它看成整个 agentic economy 的底层设施。他的一个关键预测是，到了 2030 年前后，agentic search 的总体规模可能会超过 Google Search today 的商业体量。这个判断听上去激进，但他给出的逻辑并不复杂：当每个人都有个人 Agent、每个软件都持续用检索来校验和补全自己时，搜索调用量将不是“比今天多一点”，而可能是数量级地上升。

他用一个很强的比喻来描述未来：未来的搜索之于软件世界，可能会像电力之于现代社会——不再总被用户直接感知，却会成为每个系统背后的基础供应。今天人类用户平均每天只做少量搜索，但一旦软件开始替用户持续检索、核验、发现、比对、监控，整个世界会被无数次机器检索填满。那时搜索不再是“打开网页前的入口”，而是嵌入工作流内部的持续过程。

这个视角也让 Exa 的定位变得更像云服务或支付网络，而不是一个新的门户网站。它要解决的不只是“搜到什么”，而是“怎样以合理成本、足够覆盖、足够快、足够准的方式，把外部世界稳定接入软件系统”。如果这个方向成立，那么搜索公司的产品边界、定价逻辑和客户结构，都会更接近基础设施公司，而不再只是消费互联网产品。

内容提供方不会消失，但搜索与内容之间的利益分配必须重写

这期对话里另一个值得重视的部分，是 Bryk 对内容提供方和封闭网络的看法。面对“网站不愿被 AI 抽干价值、内容平台越来越封闭”的担忧，他并没有回避，而是明确承认这是当前搜索基础设施必须面对的现实摩擦。

不过，他给出的思路并不是简单站在“抓取方”或“内容方”任何一边，而是提出一个更大的设想：如果 agentic economy 的总价值真的会远超今天的互联网广告体系，那么完全有可能重新设计一套分配机制，让内容提供者在新体系中拿到比过去更多的收入，而不是更少。换句话说，问题不该只是“AI 会不会吃掉流量”，而是“当机器成为主要信息消费者时，价值如何被重新结算”。

这当然还不是今天已经解决的问题，但它提醒我们：AI 搜索的未来，不只是一个技术问题，也是一个制度与商业结构问题。谁拥有数据、谁能访问数据、谁从检索中获益、谁承担内容生产成本，这些都决定了完美搜索是否真的有可能接近现实。Bryk 的乐观在于，他相信新经济体足够大，大到能容纳比“广告平台独占大头”更好的分配方式。

真正的瓶颈还没到模型，而会依次落在基础设施、数据与更大规模检索上

如果说这期对话有什么最“基础设施视角”的部分，那就是 Bryk 对未来瓶颈的判断。他认为，短期内限制 agentic search 发展的，首先不是模型智能，而是承载海量检索请求的基础设施。假如搜索请求量变成 Google 时代的 10 倍、100 倍、1000 倍，那么向量数据库吞吐、索引更新、系统成本、端到端延迟，都会成为真正的硬问题。

中期看，瓶颈会转向数据。因为 Agent 想理解的并不只是网页，而是整个世界：公开网页、未充分结构化的数据、组织内部知识、图像、卫星信息、人的经验、尚未被记录的事实。也就是说，搜索的上限最终取决于“世界信息被索引到什么程度”。当可检索对象从“网页”扩展到“世界”，搜索公司面对的就不再只是爬虫和排序，而是知识采集、异构数据整合与权限治理。

而在更长期，瓶颈又会重新回到检索算法本身。Bryk 提出一个很有画面感的问题：如果今天的网络规模已经极大，那么当可搜索对象再膨胀一千倍时，现有算法还能以可接受成本工作吗？如果答案是否定的，那么真正的创新并不只在模型，而在如何让“海量数据上的高质量检索”继续保持可扩展、可负担、可商用。这个问题，很可能正是未来十年搜索基础设施最硬核的战场。

结语

这场对话最值得记住的一点，不是 Exa 是否能成为下一个巨头，而是它帮我们重新理解了“搜索”这件事。过去我们把搜索看成网页入口，把它和浏览器、广告、关键词、点击联系在一起；但在 AI Agent 时代，搜索更像一种持续运行的信息供给系统。它服务的对象，不再只是一个敲关键词的人，而是一个要代表人类行动、判断、验证、执行的软件体。

也因此，未来最重要的搜索引擎，未必是“最会给人看结果”的那个，而可能是“最能给机器提供完整、可靠、可操作信息”的那个。对 Exa 来说，这是一条极其艰难、却也极具时代性的路；对整个 AI 产业来说，这期对话则提醒我们：当所有人都在讨论模型时，真正决定 Agent 上限的，也许是模型背后那层被低估的检索基础设施。

内容来源：How Exa is Building the Perfect Search Engine | Deep Dives with a16z丨a16z Deep Dives