看完这篇又看那篇——用户在用脚投票告诉你什么
当你在看某个教程的时候,经常会出现一种情况:看完A之后,自然就想去看B。比如看完”怎么计算占比”,很自然就想看”怎么画饼图”。这不是巧合,这是一种用户自己都没意识到的需求链。
用户不会告诉你”我看完A之后还需要看B”。但他们的点击轨迹会。
文档之间的”暗关系”
作为文档作者,你当然知道哪些文档之间有联系——毕竟是你写的。
但问题是:你以为的关联,和用户实际的行为关联,往往不一样。
你以为用户看完”数据源配置”应该去看”数据集管理”,但数据告诉你,他们看完之后去搜了”连接失败怎么办”。你以为的逻辑顺序,和用户真实的阅读路径,是两码事。
这就是”关联分析”的价值——用数据发现文档之间真实的、由用户行为驱动的关联。
借用电商的”购物篮”思维
关联分析这个方法,最早是电商行业用来做”啤酒和尿布”搭配推荐的。思路很简单:把文档当成商品,把用户的阅读序列当成购物篮,看看哪些文档经常被”一起买”。
三个核心指标:
A和B同时被阅读的概率。高=两篇都热门,但不代表有关联。
看了A之后又看B的概率。高=关联紧密,但若B是全站热门则可能误导。
看了A对看B的提升效果。>1=有效关联✅,≤1=无效❌
三个指标结合着看,才能判断关联的真正价值。推荐用 KULC 度量 + 不平衡比(IR) 来综合判断:KULC = 0.5 × P(B|A) + 0.5 × P(A|B),双向置信度的均值;IR = P(B|A) / P(A|B),衡量关联关系的平衡性。
真实案例:从数据到行动
数据发现:用户看完”占比计算”文档后,90% 以上会去看”饼图制作”。分析:做完占比分析的用户,下一步几乎一定会想画饼图来展示结果。
优化效果搜索量↓ 因不需再搜,阅读量↑ 因被引导过来
数据发现:用户搜”参数配置”,先后看了三篇不同的文档,每篇停留时间很短。分析:这三篇文档覆盖了不同的参数配置场景,但用户不知道哪篇适合自己——他们不是在看文档,是在”翻找”。
数据发现:用户阅读”SQL数据集定义参数”后,又看了”参数配置方案”和”集群参数配置”。从分类看都和”参数”有关,但用户真实意图是”SQL参数该怎么写”,后两篇并不是他真正需要的。
行动方案在第一篇中增加精准推荐链接,引导正确下一步
用户看完一篇文档后去看的另一篇,不一定是他真正需要的。可能是搜索或导航把他”带偏了”。
关联分析的实操清单
1
搭建数据看板—— 提取用户阅读序列数据,计算支持度、置信度、提升度,按置信度 × 支持度排序
2
找”高价值关联”—— 置信度高+支持度高→优先做超链引导;置信度高+支持度低→考虑深度内容整合;置信度低→不用管
3
执行优化—— 高关联文档间添加超链接;发现需整合内容→创建”一站式指南”;发现用户期望但不存在的关联→新内容选题
4
验证效果 → 回到Step 1—— 阅读路径是否变短?搜索量是否下降?总阅读量是否上升?持续迭代优化。
关联分析需要一定样本量。先从阅读量最大的文档开始分析,积累足够数据后再扩展到长尾内容。
用户不会说”我看完A还需要B”但他们的点击轨迹会告诉你一切。
新手、老鸟、沉默者——不同的人需要不同的”说明书”。