2026 年第二季度,一份来自百分点科技的 GEO 案例报告里出现了一个让家居行业脊背发凉的数字——某家居品牌在 AI 搜索引擎中的提及率,半年内下降了 55%。同期,另一份覆盖全球数字营销的调研指出, AI 搜索结果中的 Top5 品牌占据了高达 73%的引用份额,而 100 个长尾关键词里,只有 34 个能进入 AI 召回环节。
翻译成人话就是:66%的长尾内容,连"被 AI 看到"的资格都没有。

这场变革的怪异之处在于,没人按下任何"暂停传统搜索"的按钮。 Google 还在那里,蓝色链接也还在那里。但流量分配的底层规则,已经在过去三年里被悄悄换了。
旧契约本来就在松动
要看懂这件事,得先看懂它要颠覆的对象。
1998 年, PageRank 算法定下了一个延续二十多年的契约——网页之间的链接构成投票网络,被链接得越多、被高质量页面链接越多的页面,越值得排在前面。这个契约的内在逻辑很朴素:互联网上的人类认知,可以通过超链接的分布形态被还原出来。
在这个契约下,搜索引擎只做"发现+排名",不做"理解+回答"。围绕这套规则生长出来的是一整套生态——SEO 师傅们调标题、堆关键词、刷外链,搜索广告变成整个互联网商业模式的发动机,独立博客和地方自媒体靠"上海徐汇区 2024 年学区房政策最新解读"这样的长尾词,也能拿到稳定的流量。
但这个契约里埋着一个隐患:搜索引擎的商业利益和用户体验,长期处于微妙的张力中。零点击搜索的比例从 2016 年开始稳步攀升,到 2024 年已经突破 60%。 Google 自己的特色摘要、知识图谱卡片,已经在悄悄做"答案化"的尝试。
所以当生成式 AI 登场的时候,它撞上的不是一个稳如磐石的旧秩序,而是一个早已松动、只差临门一脚的边界。
2020 年的两块拼图
故事的真正起点埋在 2020 年。
那一年 4 月, Patrick Lewis 和 Facebook AI Research 的团队发表了《 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 》——这就是后来所有 AI 搜索产品共享的同一套架构:RAG。让生成模型在回答之前先去外部知识库里捞一把相关材料,再基于这些材料生成答案。

几乎同一时间, Karpukhin 等人发表的 Dense Passage Retrieval 论文证明了一件更要命的事情:用稠密向量做检索,可以在 Top-20 准确率上比沿用了几十年的 BM25 词项匹配高出 9-19 个百分点。
这意味着搜索的底层范式有了换骨的可能——不再依赖关键词字面匹配,而是把查询和文档都映射到同一个向量空间,靠语义距离来判定相关性。
这两块拼图当时没引起多少震动,因为它们都还困在 NLP 学术圈子里。但回头看,正是这两块拼图,决定了几年后 AI 搜索表现出来的所有特征:为什么 AI 会"重写"答案而不是列链接?因为生成模型本来就是干这个的。为什么 AI 偏好高语义密度的内容?因为向量检索就是按语义相似度算的。为什么同一个关键词在不同 AI 平台返回的结果差异可以高达 42%?因为不同平台的 embedding 模型不一样、向量空间几何结构不一样、 prompt 模板不一样。
埋下种子的人那会儿不会想到,五年后这套技术会让一个家居品牌的提及率半年内掉 55%。
答案引擎的"原罪"
2022 年 8 月,几个月前刚从 OpenAI 离职的 Aravind Srinivas ,跟前 Meta 研究员 Denis Yarats 、 Johnny Ho 、 Andy Konwinski 一起创办了 Perplexity 。
这家公司从第一天起就把自己定位成"答案引擎",核心动作只有一个:给每一句 AI 生成的回答,配上明确的来源引用链接。这个动作小,但意义大——它第一次告诉用户, AI 给的答案是有出处的、可追溯的、可质疑的;同时也第一次告诉内容创作者,你的内容可以不靠"被点击",而靠"被引用"来获得价值。
Perplexity 在很长一段时间里被嘲讽是"套壳"——前面接 GPT/Claude 的 API ,后面接 Bing 的搜索接口,自己写一层中间逻辑。但到了 2025 年中,它的估值已经冲到 180 亿美元。"套壳"反而成了优势——不被任何一个底层模型绑死,可以根据效果切换。
更关键的是,它从第一天就不靠搜索广告。Google 做不到的事情(彻底破坏链接经济),它可以毫无心理负担地做。
Aravind 做选择的时候并没有想着"颠覆 Google",他只是觉得"找资料这件事本来就不该那么麻烦"。但因为他没有 Google 那个体量的广告收入要保护,他可以做出 Google 根本做不出的产品形态。这是路径依赖的反向案例——没有历史包袱,反而是历史给的最大礼物。
Google 的纠结
Google 的反应分了三个阶段,每一阶段都看得出它的纠结。
2023 年 5 月, Sundar Pichai 在 I/O 大会上宣布 SGE ( Search Generative Experience ),但只是个实验性功能,藏在 Search Labs 里,要主动开通才能用。这种"半藏半露"的姿态,背后是 Google 最深的恐惧——它做的就是搜索广告生意, 2024 年仅 Google Search 就贡献了超过 1750 亿美元营收,任何让用户少点链接的改动,都直接威胁现金流。
2024 年 5 月 14 日, Google 把 SGE 改名 AI Overviews 并向全美用户全量推送。改名这件事很有意思——"生成式体验"听起来还像个实验,"AI 概览"听起来已经是个常驻产品。但产品上线后立刻闹了一堆笑话:建议用户"在披萨上加无毒胶水防止芝士滑落"、"医生建议每天吃一块小石头补充矿物质"——这些幻觉答案被截图传遍社交媒体, Google 市值短期蒸发了大几百亿美元。

但即便丑闻不断, Google 还是没回头。 BrightEdge 数据显示,AI Overviews 的覆盖率从 2024 年中的约 15%,飙升到 2026 年初接近 60%。 MIT 在 2024-2025 年对 280 万条谷歌搜索结果的分析更直观:以"COVID"为查询词为例, 2024 年只有约 1%的搜索会返回 AI 答案,到 2025 年这个数字飙升到了 68%。
Pew Research 在 2025 年 7 月发布的研究给这场变革写了个注脚:当页面顶部出现 AI 摘要时,用户点击下方链接的比例从普通搜索的 15%降到了约 8%;只有 1%的用户会去点 AI 摘要里的引用源链接。 MIT 的研究数字更狠——零点击率从无 AI 摘要的 60%,跃升到有 AI 摘要的 80%。
这就是流量蒸发的具体形态:流量没消失,但被截留在了 AI 生成的那一段文字里。
长尾衰退的真正机理
回到开头那个家居品牌——为什么它的 AI 提及率会在半年内掉 55%?为什么 100 个长尾词里只有 34 个进得了召回?
主流的归因是"AI 偏好大站"。这个解释对,但不够。真正的机理藏在三个层面。
第一层是向量空间的"重力坍塌"。当所有内容都被映射到 embedding 空间后,语义相似的内容会被聚到一起。 AI 在生成答案时,会从相似聚类中挑选"最有代表性"的几个来源——通常就是权重最高、内容密度最高的那个。这就像物理学中的引力坍塌:质量大的天体会吸走周围的物质。Reddit 上一条高赞回答,会吸走周围一百条相似博客的语义"质量"。

第二层是路径压缩的链式损失。传统搜索的路径是:查询→100 个结果→用户选→点击。 AI 搜索的路径是:查询→召回 50 个候选→精排选 10 个→生成模型用 3-5 个写答案。每一步都在筛选、压缩。 100 个长尾词中只有 34 个进入召回,意味着 66%的内容连"被看到"的机会都没有——这不是它们质量差,而是被向量距离这把尺子量了一遍后落在了远端。
第三层是对话场景的"短答案锁定"。多轮对话中用户期望快速明确的答案,这迫使 AI 倾向使用单一权威来源(避免"一方面…另一方面…"),而不是多源平衡。这种"短答案模式"会自我强化——用户的反馈训练让 AI 更倾向给短答案,长尾来源的多样性贡献被进一步压缩。
所以"长尾衰退"不是说长尾内容消失了,而是它们在新的流量分配机制中被折叠到了不可见的层级。它们还在那里,只是被向量空间的几何结构挤到了远端。
谁在躺赢,谁在被收割
这场变革里,最反直觉的现象是:做 AI 搜索产品的市场是分散的,但被 AI 搜索引用的内容来源是高度集中的。
Reddit 、 Wikipedia 、 YouTube 几个高 UGC 平台,正在"无心插柳"地享受复利。它们二十年前埋下的内容护城河——大量真实用户生成的、结构化( Q&A 形式)、高语义密度的内容——在 AI 搜索时代成了最大资产。 MIT 的研究发现,流量排名前 1000 的网站贡献了约 10%的引用结果,且高度集中在这几个平台。 Reddit 在 2024 年和 Google 签下 6000 万美元/年的数据授权协议,正是这种新格局下的产物。

当年 Yahoo 选了门户路线、 Wikipedia 选了 UGC 路线,二十年后两者命运的差别,很大程度上就来自那一个选择。
被收割的是另一群人。 Digital Content Next 调研显示,多数会员媒体因 AI Overviews 损失了 1%-25%的 Google 引荐流量; Cloudflare 2025 年 8 月数据更狠——出版商引荐流量从 Q1 到 Q2 下滑了 9.4%,到 2025 年中 AI 抓取占 bot 流量的 80%,但回流到出版商的流量比例不到爬取量的 0.5%。
注意,我们没有说 AI 公司一定在恶意收割内容生产者,只是陈述一个客观存在的现象:当媒体反应过来去和 OpenAI 、 Perplexity 谈授权或起诉的时候, AI 已经吃饱了它们过去几十年的存货。
传统媒体今天的困境,根源其实在 2010 年代——它们把全部赌注押在 Google 搜索引荐和 Facebook 分发上,所以当这两个入口缩减给它们的流量时,它们没有备用通道。过去靠搜索引擎吃饭的人,今天正在被同一个机制反向收割。
三足鼎立与跨平台的"罗生门"
到 2026 年中,全球 AI 搜索格局可以概括为三足鼎立: Google 、 ChatGPT 、 Perplexity ,各自代表"旧王转身、对话入口、纯血答案"三种范式。
在中国,剧本节奏滞后但烈度不弱。豆包依托抖音内容生态, 2026 年 4 月移动端月活已达 3.15-3.45 亿,稳居全球前列;夸克背靠阿里完成从工具到 AI 旗舰的转型,挤进国内 App Top3 ;秘塔走的是无广告、强调来源的 Perplexity 路线,在研究者和写作者中口碑最好; Kimi 主打长文本处理, 36 氪 2026 年 5 月的实测把它评为"最强国产 AI 搜索引擎"; DeepSeek 靠开源和成本优势在 2025 年初引爆全球,月活迅速到 1.27 亿。

到 2026 年,中国 AI 搜索用户规模已突破 7 亿,近七成消费者表示会依据 AI 推荐做消费决策。
但有意思的是用户层面的体验。 Reddit DigitalMarketing 板块上有用户反映:Perplexity 与 ChatGPT 共享的来源域名只有 11%——同一个问题在两个平台问,被引用的网站重叠度极低。
普通用户的感受更直观——同一个问题,问豆包、问秘塔、问 Kimi 、问 ChatGPT ,答案的"事实层面"会基本一致(毕竟都来自同一片互联网),但"立场、推荐、品牌提及"会差异巨大。
也就是说,42%的推荐差异不是哪个平台错了,而是在 AI 搜索时代根本就不存在"正确答案"这个唯一解——每个平台都在用自己的方式重构信息。这对品牌方来说是一道难题:你必须同时在多个平台维护可见性,因为没有任何一个平台的优化结果可以迁移到另一个平台。
从"陈列"到"主厨推荐"
如果跳出技术层面看更大的图景,这场变革像极了零售业从超市自选到精品店定制的演进。
传统搜索是"超市货架"——所有商品(链接)摊开,消费者(用户)自己挑选。商家的生存逻辑是占据好货架( Top10 排名)、做好包装( Title/Description )、做好品牌(外链/权重)。
AI 搜索是"主厨推荐"——AI 是那个理解你需求的厨师,根据你的问题搭配出一道菜(生成答案),原料(来源链接)只是后厨的事。商家的生存逻辑变成了"被主厨选中作为食材"——你的内容必须是高质量、可信任、易处理(结构化、语义清晰)的"上等食材"。

这就是 GEO ( Generative Engine Optimization )这个概念在 2023 年 11 月被普林斯顿大学的研究者第一次系统性提出后,迅速成为投资和营销主流话语的原因。普林斯顿那篇论文测试了 9 种 GEO 策略,得出了几个让做 SEO 的师傅们五味杂陈的结论:
到 2026 年 Q2 ,已经部署系统化 GEO 策略的企业,品牌在 AI 端的决策建议占有率平均提升 315%,获客成本下降 42%。 GEO 在两年内从一篇 arXiv 论文,变成了一个数十亿规模的服务市场。
回到那个家居品牌的 55%——它官网内容因为信源权威度不足、缺乏第三方背书、语义密度偏低,直接掉出了召回环节。新的指标体系也在形成——所谓"被重构次数"取代点击量、 Embedding 空间距离取代排名、语义得分高者引用概率提升 2.3 倍——这些指标看起来抽象,但本质上都在量化同一件事:你的内容能不能挤进 AI 生成答案的那段文字里。
这就是从"链接被点击"到"答案被写入"的本质变化。
三个未来剧本
这场变革在 2026 年中还远没有到稳定态。往前看,大致有三种走向。
最可能的剧本:双层市场长期共存。传统搜索不会消失, AI 搜索也不会一统天下。两者会形成分层:高频简单查询走 AI ("今天天气""欧元汇率"),深度复杂查询走传统搜索。 Google 会继续把 AI Overviews 和传统结果并列展示,让用户自选。 GEO 和 SEO 并存,品牌方需要同时优化两套体系。这是熵增最小的演化路径。

最危险的剧本:内容生产链断裂。如果 AI 对长尾内容的引用率继续下滑,独立创作者、垂直媒体、深度报道的商业模式会陆续崩盘。一旦优质内容生产者大批退出, AI 能"引用"的高质量内容存量将逐年枯竭,最终 AI 输出的答案会越来越多依赖 AI 过去生成的内容,进入"模型坍塌"的恶性循环。 MIT 那份报告里提到的担忧——"如果小众网站、深度报道的流量下降到不可持续,知识生产的商业模式会面临压力乃至崩溃"——可能在 3-5 年内成为现实。
最乐观的剧本:新型契约重建。像 Reddit 和 Google 达成的 6000 万美元/年数据授权协议那样, AI 公司和内容生产者建立新型分账机制。 Cloudflare 在 2025 年 7 月推出的"按爬取付费"政策框架,是这个剧本的早期信号。如果能形成一套类似音乐流媒体( Spotify 向唱片公司分账)的标准化分配机制,AI 搜索可以从"信息掠夺者"变成"信息生态的发动机"——它消化内容也回报内容,长尾创作者得到新的变现通道(可能不再是流量,而是"被引用费")。
回到开头那个核心判断:流量没有消失,但 AI 重新定义了价值标准。
过去的搜索引擎是"中立的中介"——它只是把链接按规则排序,价值判断交给用户。 AI 搜索不再中立——它直接生成答案,价值判断写在了模型权重里、写在了 embedding 向量里、写在了那段不到 100 字的回答里。
当一个回答只能写下 3 个来源、 5 句话、 200 个字的时候,"被写入"就是新的稀缺资源。
某种意义上,这是麦克卢汉那句"媒介即讯息"的当代翻版——AI 即媒介, AI 对内容的理解方式,决定了内容能呈现的样子。
对内容创作者和品牌方来说,最重要的不是焦虑长尾衰退、不是哀叹 SEO 失效,而是接受一个事实:信息分发的底层规则换了,按新规则重新出牌就是了。语义密度、结构化、权威背书、被多源引用——这些就是 AI 时代的新"PageRank"。
至于那些迟疑了两年才反应过来的传统玩家——历史从来不会等任何人。
夜雨聆风