当AI搜索取代百度,我花了三天读完53篇论文,发现GEO内容工程才是答案

上个月，做跨境电商的朋友老张找到我，说了一件怪事。

他的公司每年花四十多万做SEO，关键词排名一直不错。但最近半年，网站流量掉了35%。不是排名掉了，排名还在。是用户不点进来了。

"我搜了一下我们行业的词，"老张跟我说，"百度第一条还是我们，但上面多了一个AI总结框。用户看完总结，直接走了。"

他给我看了搜索结果页面。原来蓝色链接上方那个AI生成的回答区域，把用户截胡了。回答里提到了他们公司，但没有链接。提到了竞品，还带了个"推荐"。

老张的困境不是个案。2024年以来，百度、Google、Perplexity、DeepSeek、豆包全在做同一件事：把搜索结果页从"链接列表"变成"AI直接回答"。用户不用再点进去看你的文章，AI帮你看了，然后用自己的话讲一遍。

讲的时候，它可能会引用你，可能不会。可能把你说成行业第一，也可能把你的卖点安到竞品头上。

这就引出了一个新问题：你写的内容，AI搜索引擎看得见吗？它愿意引用吗？引用的时候，说的是你的事实吗？

SEO的底层逻辑变了，但大多数人还没反应过来

传统SEO的核心是"排名+点击"。你把页面做到百度第一页，用户点进来，流量就是你的。

GEO（Generative Engine Optimization，生成式引擎优化）的核心不是排名，而是三件事：被AI搜索选择、被答案吸收、被正确归因。

选择（Selection）——AI搜索引擎检索到多个来源后，会不会把你的页面选进候选池。

吸收（Absorption）——选了以后，你页面里的事实、数据、步骤，有没有真的进入AI生成的答案。

归因（Attribution）——答案里提到的事实，用户能不能知道这是你说的，还是被安到别人头上。

这三件事拆开看，就会发现传统SEO的打法大部分失效了。关键词堆砌没用——AI不是按关键词匹配的。外链数量没那么重要——AI看的是内容本身能不能被提取成事实。标题党更没用——AI不会因为你的标题够震撼就引用你。

Princeton和IIT Delhi的研究团队在2024年发表了GEO的奠基论文，他们分析了Google AI Overviews、Perplexity和Bing Chat三个引擎的引用行为，发现了一个关键结论：结构化、有证据密度、有明确来源的内容，被AI引用的概率比普通网页高3到5倍。

这个结论后来被yaojingang的团队进一步验证。他们从53篇AI Search/GEO/AEO论文中提炼出了8条第一性原理，整理成了一套叫"GEO内容工程"的工程方法论。

GEO内容工程：把"写文章"变成"造知识原子"

yaojingang的GEO内容工程合集我读了三天。说实话，第一次看的时候觉得太学术了，满篇都是"提示图谱""证据原子""归因闭环"这些词。但读到第二遍，我发现它其实解决了一个很实际的问题：内容生产怎么从"写一篇篇文章"变成"生产可被AI引用的知识单元"。

这套方法论把GEO内容工程拆成了六层架构：

L0 战略与边界——你要在哪些AI搜索平台上被看到？要被什么问题问到？要实现什么目标（被提及、被引用、被推荐、还是直接转化）？

L1 提示图谱——真实用户会怎么问？不是关键词，是完整的问题。一个种子问题"哪款AI客服适合Shopify卖家"要扩展成20个变体：月订单5000单怎么选？Gorgias和Zendesk哪个更适合中文团队？AI客服能不能处理退货？

L2 知识资产——你手里有哪些可以被引用的事实？不是"产品介绍"，而是"支持20种语言""7天内部署""月订单1000到10000单的Shopify店铺适用"这种可以被AI直接拿走用的证据块。

L3 结构与证据——内容怎么组织才能同时让检索器、重排器和生成模型看懂？H2标题对应用户问题，每段只回答一个核心点，表格化对比，FAQ补边界。

L4 权威网络——同一个事实，不能只有你自己说。官网、第三方评测、行业榜单、开发者文档、客户案例，五个来源讲同一件事，AI搜索才会觉得这是可信的。

L5 测量与归因——优化有没有效果？不能看一次截图就下结论。同一问题在AI搜索上跑5次，分不同时间段，记录引用率、吸收率、归因准确率的变化。

L6 治理——哪些事不能做？隐藏提示注入、虚假引用、排名操纵，短期可能有效，长期会被平台过滤。白帽GEO的边界要守住。

这六层不是概念游戏。每一层都有明确的输入、输出和质量门禁。比如L2的输出是"知识原子库"——把你的白皮书、案例、FAQ拆成一个个独立的事实单元，每个单元都带来源、日期、适用场景和置信度。

为什么要拆到这么细？因为AI搜索引擎就是这么工作的。它不会读你整篇文章，它会把内容切块，存进向量数据库，然后根据用户问题检索最相关的几块，拼成答案。你提前把内容拆好、打好标签，它就更容易命中你。

20个开源Skill：从战略诊断到效果监测的完整工具链

方法论有了，但落地执行是个体力活。yaojingang的团队把GEO内容工程的每个环节做成了可复用的Skill包，开源在GitHub上（yao-geo-skills），一共20个，按7个分类组织。

我最初以为这就是一堆prompt模板。仔细看了才发现，每个Skill都是一个完整的执行单元，有触发条件、输入输出契约、评估用例和产物校验。不是"帮我写一篇GEO文章"这种泛泛的提示词，而是"输入一篇文章，按9个维度评分、改写、输出评分报告和变更说明"这种精确到可以写进SOP的工具。

20个Skill覆盖了GEO内容工程的全链路：

战略诊断（2个）——全景诊断和30/60/90天执行路线图。适合项目启动和季度复盘。

页面技术（2个）——诊断网页的可抓取性和AI可抽取性，生成GEO友好页面的信息架构蓝图。

内容生产（6个）——这是最实用的部分。标题优化、科普文章生成、对比内容生成、榜单评测生成、旧文GEO改造、文章AI友好化改造。6个Skill对应6种常见内容类型，每种都有标准化的生产流程。

知识资产（2个）——品牌知识图谱和知识库构建。把企业信息变成AI可检索的结构化数据。

监测归因（4个）——GEO效果追踪方案设计、AI答案监测月报、DeepSeek重复采样、ChatGPT AI Search采样。这4个Skill解决了GEO最大的痛点：怎么证明优化有效。

运营和研究（4个）——GEOFlow CLI运营操作、模板映射、主题编辑、AI搜索问题集扩展。

举个具体的例子。yao-geo-article-friendly这个Skill，专门做"已有文章的GEO友好化改造"。它的输入是一篇文章，输出是五样东西：改造后的完整文章、GEO优化度评分、改造执行说明、需要补充的内容列表、风险提示。

它的工作流程是这样的：先给原文打分（9个维度，100分制，包括检索就绪度、语义意图覆盖、证据吸收能力、引用归因清晰度等），然后按优先级改写——先补证据，再调结构，再优化语义密度，最后加权威信号。改完以后再打一次分，让你看到具体在哪些维度提升了多少。

最狠的是它的证据纪律。改写时，每个主张必须标注来源：是"原文支持"、"外部已核验"还是"建议补充"。不能凭空编造数据，不能把竞品的信息安过来。改不了的标注为"建议补充"，留给用户去核实。

这种做法和大多数AI写作工具形成鲜明对比。大部分工具的逻辑是"帮我写得更漂亮"，这个Skill的逻辑是"帮我变得更可被引用"。漂亮是给人看的，可被引用是给AI搜索引擎用的——在GEO时代，后者的价值远大于前者。

元技能系统：一个Skill工厂

20个Skill还不够。yaojingang还做了一个更野的东西——yao-meta-skill，一个"生产Skill的Skill"。

这个项目把"怎么把重复工作流变成可复用Skill"这件事本身做成了系统工程。它的核心理念是：团队最有价值的运营知识散落在聊天记录、个人prompt和口头习惯里，这些东西应该被捕获、标准化、变成可安装的Skill包。

yao-meta-skill的设计很有工程感。每个Skill要经过意图对话、触发评估、引用扫描、输出评估、打包验证和安装模拟六道工序。它甚至有一个"世界级证据"系统——在声明某个Skill是"世界级"之前，必须收集足够的执行证据、盲审结果和基准可复现性数据。

在他们的质量基准测试中，yao-meta-skill得了91.5分（满分100），Anthropic的Skill Creator得67.5，OpenAI的得50.5。差距主要在工具链完整性和治理成熟度上。yao-meta-skill从创作到验证到打包到发布是一个闭环，另外两个更像是写作指南。

说实话，看到这里的时候我有个疑问：这套东西会不会太重了？小团队用得起吗？

后来我想明白了。20个GEO Skill不是让你一次全装上，而是按需取用。你只是想改一篇文章，装一个yao-geo-article-friendly就够了。你想做全盘GEO战略，从诊断到执行到监测，那就按分类逐步引入。yao-meta-skill面向的是想建设Skill体系的团队，个人创作者可以先不管。

回到老张的问题

我把GEO内容工程的思路讲给老张听，他沉默了一会儿，问了一个很实际的问题："那我现在的100多篇文章，怎么办？"

答案是分三步走。

第一步，用提示图谱工具（yao-geo-intent-miner）把行业问题扩展成200个以上的查询变体，看看老张的内容覆盖了多少。大概率会发现，用户问的很多问题，老张的文章根本没回答。

第二步，用文章友好化改造工具（yao-geo-article-friendly）把现有文章批量改造。每篇打分、改写、补证据、加结构。改造前后的评分差就是优化效果的量化指标。

第三步，用监测工具（yao-deepseek-crawler和yao-chatgpt-crawler）做重复采样。同一个问题在DeepSeek上跑10次，看看老张的品牌被提及几次、被引用几次、归因是否正确。优化前后对比，就是GEO的真实ROI。

老张听完说："这不就是把我们之前做SEO的流程，在AI搜索上重做一遍吗？"

差不多。但有一个根本区别：SEO优化的是排名，你做到第一页就是第一页。GEO优化的是AI答案，而AI答案是动态的、个性化的、不稳定的。今天被引用，明天可能就不被引用了。所以GEO不是一次性优化，是持续监测、持续迭代。

这也是为什么GEO内容工程强调"重复测量"和"治理闭环"，不是因为学术严谨，是因为AI搜索的波动性比传统搜索大一个数量级。

53篇论文、6层架构、20个开源Skill、1个元技能系统。yaojingang的团队做了一件很扎实的事：把GEO从"几个prompt技巧"变成了一套可落地的工程体系。

如果你也在做内容，也在困惑为什么流量在掉、为什么AI搜索不引用你，这套东西值得花几天时间认真看看。GitHub仓库地址是github.com/yaojingang/yao-geo-skills，MIT协议，免费用。