
起始于用户进行信息检索:
→ ① 查询理解与改写
→ ② 多源信息检索
→ ③ 综合评分排序
→ ④ 大模型生成回答
每一层都有独立的专业技术支撑,想要GEO优化快速出效果,需要针对每一层的底层逻辑有一定的深度了解,分别制定优化策略,这对于GEO运营和服务商要求还是蛮高。
接下来,我们将详细拆解上述每一个环节:
1、查询理解与改写
我们知道当你在AI大模型中,查询某一个问题时,AI大模型最先需要处理的是精准定位你搜索查询意图,我们称之为查询理解。从技术的角度,AI大模型会经历如下几个流程:
① 查询意图分类
首先AI大模型将你要查询的问题进行合理的分类,一般主要包括:关键词型,实体型,关系型等。
这里我们便于理解,将其分为:「信息型」「导航型」「交易型」
简单举例:
场景1:用户问"iPhone 16怎么样" → 意图识别为「信息型」
场景2:用户问"附近的火锅店" → 意图识别为「导航型」
场景3:用户问"帮我买张去北京的机票" → 意图识别为「交易型」
AI大模型通过查询语义理解,精准定位查询类型,而后调用不同信息检索渠道,进行信息反馈,比如:
「信息型」→ 触发产品评测内容召回
「导航型」→ 触发本地搜索+地图API
「交易型」→ 触发OTA接口
当然,在这个过程中,AI大模型经常会遇到一个问题,就是“模糊查询”亦或是“输入错误查询”,这个时候就会涉及到:用户输入查询改写。
② 信息查询改写
刚我们提到AI大模型对用户原始查询会进行纠偏和改写,为什么需要这个流程,因为在日常查询过程中,我们可能会因为理解偏差,错误输入,给到大模型非直观理解内容查询。
显而易见,为了更好精准的反馈用户信息,AI大模型需要这个改写流程。
它会基于用户查询偏差,生成内部查询语句(改写后的查询内容),执行检索,从而提高召回率。
③ 用户向量特征
这里可以肯定的和大家讲:AI大模型是存在一定个性化搜索展现。因此,接下来,严格流程还需要针对目标查询用户,进行向量数据特征整理。
其主要包括:
用户基础特征:人物画像属性
短期兴趣特征:近期搜索浏览行为
长期兴趣特征:长期搜索浏览行为
技术策略表现为:将查询文本切词→语义特征提取→查询语义向量,再与用户特征向量组合→输入神经网络→用户表示向量
通过上述流程,AI大模型掌握用户查询意图,以及用户日常查询习惯,而后在执行信息检索数据反馈。
2、多元信息检索
在信息改写与用户特征定位之后,接下来AI大模型会通过多元信息检索,采用多路召回与融合的策略,进行TOP-K 去重,融合,排序。
通常现有的AI大模型,主要包括如下四个检索渠道:
① 向量数据库检索【核心查询】
所谓向量数据库检索,主要是指AI大模型在早期语料库训练的结果,主要表现为:历史网页、知识库、文档书籍、数据库、专利等。
通常这个查询延迟要<100ms
通俗讲:这部分内容为AI大模型早期收集整理的部分数据。
② 知识图谱查询
当AI大模型在向量数据库中,并不能精准定位一些事实的时候,特别是关系类型,这个时候就需要涉及到知识图谱的数据调用。
举个简单例子:
蝙蝠侠IT,是我早期使用的网络昵称,英文:BATmanIT,起名源于BAT+man+IT
大连蝙蝠侠科技,是我们公司的简称。
AI大模型在早期抓取与识别的时候,经常不能精准定位二者之间的关系,并将其当做两个独立机构,这个时候它就需要借助【知识图谱】进行分析。
因此,从GEO的角度,我们需要合规的优化知识图谱。现在我们将蝙蝠侠IT定义为大连蝙蝠侠科技的数字营销品牌。
AI大模型通过知识图谱分析,当你用百度检索蝙蝠侠IT时,它就可以精准的定位与展现二者的关系。
③ 实时网页抓取【搜索增强API查询】
我们知道信息是动态变化的,AI大模型的向量数据库迭代周期有限,为了满足一些时效性信息比较强的信息查询,以及弥补一些稀缺长尾问题查询。
AI大模型会通过搜索增强策略,利用不同搜索引擎的API进行数据查询与调用,这里核心包括:
特定关键词检索网页查询
时效性网页数据内容获取
这里需要明确的一个技术要点:API数据查询结果,同样会进入多路召回融合流程,与其他通道(向量库、知识图谱、历史网页索引等)的结果一起进行相关性评分和排序。
很多GEO运营,经常会错误理解这个问题,貌似大模型搜索增强API检索内容,不被参与信息处理与评分,是错误的,需要引起注意。
④ 结构化数据API
这里AI大模型结构化数据API调用,理解相对比较简单,主要表现是特定场景下的数据调用,比如:
天气预报
金融数据
车票航班
数据换算
等等一系列相关的数据展现。
通过上述内容,我们可以基础判断,AI大模型在检索阶段,一般主要通过上述四个渠道获取相关性信息,具体占比,预估猜测大概是:
向量数据库 -> 占比65%
知识图谱 -> 占比15%
搜索增强API -> 占比15%
结构化API -> 占比10%
这个时候接下来,我们在讲一下前文的TOP-K,这里的TOP-K主要是指不同检索渠道调用的召回数量。根据这些召回数量,进行去重、融合、排序。
主要表现【猜测】:
这里的召回数量,仅仅是一个猜测。
其中一个值得关注要点,就是我们在做GEO时,网页索引与实时抓取,你需要利用SEO技术,将其排名在至少TOP5,这样才有概率被索引。
到这个阶段,AI大模型多元信息检索,基本完成,接下来,我们简单讨论一下综合评分排序 。
3、综合评分排序
当AI大模型 -> 执行查询改写 -> 到多元信息渠道检索,之后实际上就进入了我们重点关注的环节:综合评分排序环节,理论上在这个环节是一个相关性排序,置信度加权的环节。
具体表现为如下几个维度:
① 语义相似性
这个阶段AI大模型主要是计算用户查询与召回文本片段的语义匹配程度,一般通过计算向量余弦相似度来统计。
简单直白讲,这个阶段主要考察内容文本的:
向量化质量:文本转向量的精准性识别,体现在->内容结构化的标记。
语义丰富度:内容包含的语义信息量,体现在->包含定义、对比、数据、案例、结论。
关键词覆盖:与查询关键词的匹配度,体现在->标题和正文的关键词布局。
语义完整性:段落自我的包含程度,体现在->独立段落主题表达。
简单理解:内容语义越丰富,向量化质量越高,检索命中率越高。
这里面我们讲一个算是题外话:内容特征匹配。
最近,我们发现经常会有一些GEO技术分析,倾向性做技术反推,通过不断检索,查找特定检索词的输出结果的匹配特征。
比如:标题的语义相关性。
其实:也应包含内容本身的语义相关性。
如下图:

我们可以看到:当我们问GEO公司哪家好的时候,所参考的引用源里,包含了一些语义相似性特征词,比如:
GEO服务商,GEO企业=GEO公司
TOP5,TOP10=榜单=排名
2026年,3月=时效性,时间因子
理论上,我们参考这些数据特征,可以快速定义当下匹配索引要素,属于锦上添花。
实际上,这部分特征,属于动态变化。
2024年6月份,我们和少数GEO服务商在做GEO项目实测的时候发现:
GEO公司哪家好
十大GEO排名公司推荐
国内顶尖GEO公司有哪些
出现在这些标题里的公司会被AI大模型优先推荐,后续一些GEO公司基于广告法的合规性,逐渐将:
排名 -> 替换 -> 榜单
顶尖 -> 替换 -> TOP
再此之后,2025年5月份大量GEO服务商效仿标题撰写策略,就成为当下展现特征。这个过程中,AI大模型学习了这些数据特征的变化,而并非向量数据库中固有的匹配逻辑。
归根结底,无论用户行为特征如何变化,内容匹配逻辑都完全基于:语义相似性,也就是上述我们表述的4个核心要素。
② 权威性
权威性无论是SEO还是GEO阶段,都是我们一直以来强调的核心要素,当然对于GEO而言,它也是重中之重。
AI大模型在做内容质量度评估时,一般会引入"权威性"维度,过滤召回结果。通常主要表现在如下几个维度:
域名年龄与网站权重
内容原创度:内容的原创属性,实体关系标注,品牌唯一性等。
更新频率:内容更新的频次。
来源可靠性:官媒,权威媒体,个人博客。
引用数据:是否引用权威数据
垃圾内容:低质量内容输出体量
内容权威度在现阶段GEO推广中,扮演者核心重要的成分,精准掌握不同行业权威媒体数据源,是超越竞对的致胜法宝。
③ 时效性
AI大模型对于时效性要求很高,在评估内容的时间属性时,时效性越高的内容在相关查询中排序越靠前。
AI大模型也非常习惯性的优先抓取检索,带有时间标识的内容。
常见的触发场景:
新闻查询:时效性权重提升至30%+
历史知识查询:时效性权重降至5%
产品评测:时间越近权重越高
评估要素:
发布时间:内容最新发布的时间
更新时间:内容修改后,更新的时间
时效性判断:内容适用的时间范围
事件关联:热点事件的关联程度
其中值得说明的是:关于时效性内容,我们应该采用迭代思维去拓展,它应不单单指时间因子,也可以理解为流行趋势。
比如:
当我们写一篇关于:如何选择GEO服务商?文章时。大量的内容都会提到:应采用白帽GEO合规策略做GEO推广。
如果你的内容,缺失最新的这条变化,可能被索引的概率就会下降。
④ 完整性
所谓的完整性,实际上从技术的角度来评估,主要是指:用户问题回答的完整程度,是否满足多维度的检索需求。
比如:
你的问题定义是否清晰?
不同观点是否覆盖?
内容的支撑数据/案例是否充足?
结论建议是否明确?
延伸阅读是否提供?
⑤ 个性化评分
这个是现阶段GEO服务商,经常会忽略的一个问题,并且在当下时间节点,变化非常明显。
在做个性化评分的过程中,越来越多的AI大模型,在参考地理位置输出。
其核心原理包括:用户历史行为 → 用户表示向量 → 融入排序网络 → 个性化结果
具体表现为:
| 新手用户 | ||
| 专业用户 | ||
| 决策者 | ||
| 普通消费者 | ||
| 从业者 |
这就需要我们在做GEO内容策略时,从不同用户画像维度,制定多维度满足策略。
到此,AI大模型通过针对综合得分进行临时查询排序,具体表现:
综合得分 = A× 语义相似度 + B × 权威性 + C × 时效性 + D × 完整性
+ E× 个性化加权(用户向量调整)
其中:ABCDE是一个系数,A可能占有40%的权重,而B一般高达30%的权重。
由于:大量的GEO服务商在撰写GEO稿件时,采用AI大模型输出策略,一般GEO稿件输出逻辑,基本会完全匹配A的语义相似度。
因此,从现阶段来评估:B的权威性在GEO排名过程中,将会起到较大的权重影响。
现实:对于一个专业的GEO服务商,但凡实操超过5个不同行业的GEO项目,且稳定排名持续3个月以上,就会非常清晰,权威性的重要程度。
4、大模型生成回答
当经过上述三个流程,实际上AI大模型首次信息查询反馈,基本已经结束,但在实际过程中,并非每一次查询结果,都能够得到用户的满意,这就需要AI大模型不断迭代生成答案,具体流程表现为:
用户提问 → 模型生成答案 → 用户反馈 → 反馈数据 → 模型参数更新 → 优化后续答案
这其中用户的信息反馈,就显得格外重要,主要包括:
① 用户直接反馈信息
用户点击参考源链接
浏览跳过行为
用户追问
负面反馈
收藏答案
② 用户间接反馈行为
停留时长
滚动深度
返回行为
复制行为
AI大模型一般会通过上述策略判断,答案是否优质,同时根据用户行为反馈,进行特定模型迭代,进而进一步优化后续答案。
总结:任何技术策略的制定,都需要依托算法底层逻辑,无论是SEO还是GEO排名,都是有法可依,作为专业的GEO服务商与运营人员,我们需要清晰的掌握AI大模型基本搜索排序原理,而不是主观臆想和少量实测,就望下定义。
GEO理论实测与项目实战具有一定差别,不同行业,拥有不同的解决方案,这需要我们长期不断的跟踪AI大模型算法迭代,通过项目实操,培养GEO优化敏感度,实时关注算法微妙变化,从而调整GEO优化策略。上述内容,仅是蝙蝠侠IT一家之言,仅供参考。
相关阅读:
315曝光GEO“灰产”,一文分清正规GEO与AI投毒,企业避坑必看!
GEO红利转瞬即逝,中小企业营销,应如何抢占先机,晚一步良机难觅!
品牌GEO优化:获客咨询转化,网站SEO数据,为什么要做到如下3点!
关注蝙蝠侠IT:带你看最真实的白帽SEO与GEO!
在这里,你可以了解到当下,各种网站类型,搜索排名的技巧与注意事项,各大AI模型的GEO优化,能做,不能做,我们都会告诉你真相。
本分做人,踏实做事,白帽SEO,和大家一起共同成长。
夜雨聆风