上个月,做跨境电商的朋友老张找到我,说了一件怪事。
他的公司每年花四十多万做SEO,关键词排名一直不错。但最近半年,网站流量掉了35%。不是排名掉了,排名还在。是用户不点进来了。
"我搜了一下我们行业的词,"老张跟我说,"百度第一条还是我们,但上面多了一个AI总结框。用户看完总结,直接走了。"
他给我看了搜索结果页面。原来蓝色链接上方那个AI生成的回答区域,把用户截胡了。回答里提到了他们公司,但没有链接。提到了竞品,还带了个"推荐"。
老张的困境不是个案。2024年以来,百度、Google、Perplexity、DeepSeek、豆包全在做同一件事:把搜索结果页从"链接列表"变成"AI直接回答"。用户不用再点进去看你的文章,AI帮你看了,然后用自己的话讲一遍。
讲的时候,它可能会引用你,可能不会。可能把你说成行业第一,也可能把你的卖点安到竞品头上。
这就引出了一个新问题:你写的内容,AI搜索引擎看得见吗?它愿意引用吗?引用的时候,说的是你的事实吗?

SEO的底层逻辑变了,但大多数人还没反应过来
传统SEO的核心是"排名+点击"。你把页面做到百度第一页,用户点进来,流量就是你的。
GEO(Generative Engine Optimization,生成式引擎优化)的核心不是排名,而是三件事:被AI搜索选择、被答案吸收、被正确归因。
选择(Selection)——AI搜索引擎检索到多个来源后,会不会把你的页面选进候选池。
吸收(Absorption)——选了以后,你页面里的事实、数据、步骤,有没有真的进入AI生成的答案。
归因(Attribution)——答案里提到的事实,用户能不能知道这是你说的,还是被安到别人头上。

这三件事拆开看,就会发现传统SEO的打法大部分失效了。关键词堆砌没用——AI不是按关键词匹配的。外链数量没那么重要——AI看的是内容本身能不能被提取成事实。标题党更没用——AI不会因为你的标题够震撼就引用你。
Princeton和IIT Delhi的研究团队在2024年发表了GEO的奠基论文,他们分析了Google AI Overviews、Perplexity和Bing Chat三个引擎的引用行为,发现了一个关键结论:结构化、有证据密度、有明确来源的内容,被AI引用的概率比普通网页高3到5倍。
这个结论后来被yaojingang的团队进一步验证。他们从53篇AI Search/GEO/AEO论文中提炼出了8条第一性原理,整理成了一套叫"GEO内容工程"的工程方法论。
GEO内容工程:把"写文章"变成"造知识原子"
yaojingang的GEO内容工程合集我读了三天。说实话,第一次看的时候觉得太学术了,满篇都是"提示图谱""证据原子""归因闭环"这些词。但读到第二遍,我发现它其实解决了一个很实际的问题:内容生产怎么从"写一篇篇文章"变成"生产可被AI引用的知识单元"。
这套方法论把GEO内容工程拆成了六层架构:

L0 战略与边界——你要在哪些AI搜索平台上被看到?要被什么问题问到?要实现什么目标(被提及、被引用、被推荐、还是直接转化)?
L1 提示图谱——真实用户会怎么问?不是关键词,是完整的问题。一个种子问题"哪款AI客服适合Shopify卖家"要扩展成20个变体:月订单5000单怎么选?Gorgias和Zendesk哪个更适合中文团队?AI客服能不能处理退货?
L2 知识资产——你手里有哪些可以被引用的事实?不是"产品介绍",而是"支持20种语言""7天内部署""月订单1000到10000单的Shopify店铺适用"这种可以被AI直接拿走用的证据块。
L3 结构与证据——内容怎么组织才能同时让检索器、重排器和生成模型看懂?H2标题对应用户问题,每段只回答一个核心点,表格化对比,FAQ补边界。
L4 权威网络——同一个事实,不能只有你自己说。官网、第三方评测、行业榜单、开发者文档、客户案例,五个来源讲同一件事,AI搜索才会觉得这是可信的。
L5 测量与归因——优化有没有效果?不能看一次截图就下结论。同一问题在AI搜索上跑5次,分不同时间段,记录引用率、吸收率、归因准确率的变化。
L6 治理——哪些事不能做?隐藏提示注入、虚假引用、排名操纵,短期可能有效,长期会被平台过滤。白帽GEO的边界要守住。
这六层不是概念游戏。每一层都有明确的输入、输出和质量门禁。比如L2的输出是"知识原子库"——把你的白皮书、案例、FAQ拆成一个个独立的事实单元,每个单元都带来源、日期、适用场景和置信度。
为什么要拆到这么细?因为AI搜索引擎就是这么工作的。它不会读你整篇文章,它会把内容切块,存进向量数据库,然后根据用户问题检索最相关的几块,拼成答案。你提前把内容拆好、打好标签,它就更容易命中你。
20个开源Skill:从战略诊断到效果监测的完整工具链
方法论有了,但落地执行是个体力活。yaojingang的团队把GEO内容工程的每个环节做成了可复用的Skill包,开源在GitHub上(yao-geo-skills),一共20个,按7个分类组织。
我最初以为这就是一堆prompt模板。仔细看了才发现,每个Skill都是一个完整的执行单元,有触发条件、输入输出契约、评估用例和产物校验。不是"帮我写一篇GEO文章"这种泛泛的提示词,而是"输入一篇文章,按9个维度评分、改写、输出评分报告和变更说明"这种精确到可以写进SOP的工具。
20个Skill覆盖了GEO内容工程的全链路:

战略诊断(2个)——全景诊断和30/60/90天执行路线图。适合项目启动和季度复盘。
页面技术(2个)——诊断网页的可抓取性和AI可抽取性,生成GEO友好页面的信息架构蓝图。
内容生产(6个)——这是最实用的部分。标题优化、科普文章生成、对比内容生成、榜单评测生成、旧文GEO改造、文章AI友好化改造。6个Skill对应6种常见内容类型,每种都有标准化的生产流程。
知识资产(2个)——品牌知识图谱和知识库构建。把企业信息变成AI可检索的结构化数据。
监测归因(4个)——GEO效果追踪方案设计、AI答案监测月报、DeepSeek重复采样、ChatGPT AI Search采样。这4个Skill解决了GEO最大的痛点:怎么证明优化有效。
运营和研究(4个)——GEOFlow CLI运营操作、模板映射、主题编辑、AI搜索问题集扩展。
举个具体的例子。yao-geo-article-friendly这个Skill,专门做"已有文章的GEO友好化改造"。它的输入是一篇文章,输出是五样东西:改造后的完整文章、GEO优化度评分、改造执行说明、需要补充的内容列表、风险提示。
它的工作流程是这样的:先给原文打分(9个维度,100分制,包括检索就绪度、语义意图覆盖、证据吸收能力、引用归因清晰度等),然后按优先级改写——先补证据,再调结构,再优化语义密度,最后加权威信号。改完以后再打一次分,让你看到具体在哪些维度提升了多少。
最狠的是它的证据纪律。改写时,每个主张必须标注来源:是"原文支持"、"外部已核验"还是"建议补充"。不能凭空编造数据,不能把竞品的信息安过来。改不了的标注为"建议补充",留给用户去核实。
这种做法和大多数AI写作工具形成鲜明对比。大部分工具的逻辑是"帮我写得更漂亮",这个Skill的逻辑是"帮我变得更可被引用"。漂亮是给人看的,可被引用是给AI搜索引擎用的——在GEO时代,后者的价值远大于前者。
元技能系统:一个Skill工厂
20个Skill还不够。yaojingang还做了一个更野的东西——yao-meta-skill,一个"生产Skill的Skill"。

这个项目把"怎么把重复工作流变成可复用Skill"这件事本身做成了系统工程。它的核心理念是:团队最有价值的运营知识散落在聊天记录、个人prompt和口头习惯里,这些东西应该被捕获、标准化、变成可安装的Skill包。
yao-meta-skill的设计很有工程感。每个Skill要经过意图对话、触发评估、引用扫描、输出评估、打包验证和安装模拟六道工序。它甚至有一个"世界级证据"系统——在声明某个Skill是"世界级"之前,必须收集足够的执行证据、盲审结果和基准可复现性数据。
在他们的质量基准测试中,yao-meta-skill得了91.5分(满分100),Anthropic的Skill Creator得67.5,OpenAI的得50.5。差距主要在工具链完整性和治理成熟度上。yao-meta-skill从创作到验证到打包到发布是一个闭环,另外两个更像是写作指南。
说实话,看到这里的时候我有个疑问:这套东西会不会太重了?小团队用得起吗?
后来我想明白了。20个GEO Skill不是让你一次全装上,而是按需取用。你只是想改一篇文章,装一个yao-geo-article-friendly就够了。你想做全盘GEO战略,从诊断到执行到监测,那就按分类逐步引入。yao-meta-skill面向的是想建设Skill体系的团队,个人创作者可以先不管。
回到老张的问题
我把GEO内容工程的思路讲给老张听,他沉默了一会儿,问了一个很实际的问题:"那我现在的100多篇文章,怎么办?"
答案是分三步走。
第一步,用提示图谱工具(yao-geo-intent-miner)把行业问题扩展成200个以上的查询变体,看看老张的内容覆盖了多少。大概率会发现,用户问的很多问题,老张的文章根本没回答。
第二步,用文章友好化改造工具(yao-geo-article-friendly)把现有文章批量改造。每篇打分、改写、补证据、加结构。改造前后的评分差就是优化效果的量化指标。
第三步,用监测工具(yao-deepseek-crawler和yao-chatgpt-crawler)做重复采样。同一个问题在DeepSeek上跑10次,看看老张的品牌被提及几次、被引用几次、归因是否正确。优化前后对比,就是GEO的真实ROI。
老张听完说:"这不就是把我们之前做SEO的流程,在AI搜索上重做一遍吗?"
差不多。但有一个根本区别:SEO优化的是排名,你做到第一页就是第一页。GEO优化的是AI答案,而AI答案是动态的、个性化的、不稳定的。今天被引用,明天可能就不被引用了。所以GEO不是一次性优化,是持续监测、持续迭代。
这也是为什么GEO内容工程强调"重复测量"和"治理闭环",不是因为学术严谨,是因为AI搜索的波动性比传统搜索大一个数量级。
53篇论文、6层架构、20个开源Skill、1个元技能系统。yaojingang的团队做了一件很扎实的事:把GEO从"几个prompt技巧"变成了一套可落地的工程体系。
如果你也在做内容,也在困惑为什么流量在掉、为什么AI搜索不引用你,这套东西值得花几天时间认真看看。GitHub仓库地址是github.com/yaojingang/yao-geo-skills,MIT协议,免费用。
夜雨聆风