哪篇文档有问题？一套加权算法帮你自动揪出来

几千篇文档靠人工看不过来——让算法先替你把最可疑的几十篇挑出来。

你有几千篇文档。我问你：你知道其中哪些是“有问题”的吗？大概率，你答不上来。

而几种最容易想到的笨办法，其实都不靠谱：

靠人工一篇篇看几千篇，看到猴年马月。

靠用户举报太滞后——等用户气到来投诉，伤害早已造成。

靠评论数量排序也不靠谱，评论多的往往只是热门文档，看的人多评论自然多，不一定有问题。

你需要的，是一套自动化的“问题文档识别”机制，让算法先从几千篇里，把最可疑的那几十篇挑出来。

一、核心思路：把“用户觉得有问题”的信号加权综合

别被“算法”两个字吓到，核心逻辑特别朴素，一句话：

把所有“用户觉得这篇有问题”的信号，加权综合成一个分数。分数越高，越可能有问题。

一个可用的公式长这样：问题文档得分 = 评论向量 × 0.6 + 解决率向量 × 0.4。

“评论向量”是从评论里提取的“问题信号强度”——差评有多少、有多狠；“解决率向量”是用户点“没用”的比例——点“没用”的人越多，说明它越没解决问题。

那为什么是 0.6 和 0.4，不是五五开？因为信息量不一样。评论是“开放式”的，它告诉你具体哪里不对（“第三步那个按钮根本找不到”）；而“有用/没用”只是个二元按钮，只告诉你“行/不行”，不告诉你“为什么”。信息量大的，自然该给更高权重。这个权重不是金科玉律，可按你的数据去调，但“评论权重高于点踩权重”这个大方向通常成立。

二、算法的执行步骤

数据筛选先过滤出评论量最多的前 1500 篇。评论太少没有统计意义——1 条差评和 50 条差评，后者显然更该优先。

过滤好评含“好”“棒”“有用”“清晰”的评论先剔掉。这次目标是“找问题”，不是“评优”，好评是干扰项。

过滤文档组级评论有些吐槽是冲着一整组文档、甚至整个产品去的，别把账算到无辜的单篇头上。

计算加权得分对每篇分别算“评论向量”和“解决率向量”，再加权求和。

排序输出按总分从高到低排，输出一张“最可能有问题”的清单。算法的活到此为止，真正的难点在后面。

其中“评论向量”可以综合考虑这么几件事：

差评的数量（评论越多且越偏负面，向量值越高）；
评论的情感强度（“完全看不懂”显然比“有点复杂”更严重）；
评论的时间衰减（最近的差评，比一年前的更值得重视）。

而“解决率向量”则简单些：解决率 = 点“有用” ÷（点“有用” + 点“没用”），解决率越低，向量值越高。

三、拿到清单之后，先别急着改

很多人拿到“问题文档 Top 50”，第一反应是把清单甩给作者：去，改！打住——这是最容易好心办坏事的一步。正确做法是先分类，再分配，因为“有问题”背后藏着完全不同的病因：

问题类型	表现	处理方式
内容错误类	文档描述和实际功能对不上	找产品确认后再改
内容缺失类	用户要的场景，文档压根没覆盖	补内容
表述不清类	内容是对的，但用户看不懂	优化表述、增加示例
产品缺陷类	不怪文档，是产品本身有 Bug	反馈给产品团队

一篇“产品缺陷类”文档，你让作者怎么改都没用，因为根子不在文档上。所以第一步永远是分类，第二步才是分配。

四、一个容易被忽略的细节：“踩”也是信号

有些用户是“沉默的差评者”——他懒得打字写评论，但会顺手点一个“踩”。如果算法只盯着评论文本，就会把这一大批沉默信号全漏掉。所以一套完整的得分，应该同时吃进两种信号：文本信号（评论说了什么）+ 行为信号（用户做了什么）。 说的和做的，合起来才是真相。

💡 给写作者的话

算法的意义，从来不是“追责”，不是找出“谁写的烂文档”。它是让问题被发现得更早——早到在用户大规模受影响之前，早到在它变成一场投诉风暴之前。我们和算法的关系，不该是“它监工、我挨批”，而该是“它帮我把注意力，精准地放在最该花力气的地方”。几千篇文档，你的精力有限，算法帮你做的，是排序。

✅ 行动清单

检查你有没有“有用/没用”反馈机制——如果没有，优先上线它

导出评论数据，手动验证“问题文档 Top 10”，看算法和你的经验判断是否一致

建立问题文档的“分类处理”流程：内容错误 / 内容缺失 / 表述不清 / 产品缺陷

设一个阈值——得分超过多少的文档，必须在一周内处理

一句话记住这篇

算法不是用来追责是帮你把有限的力气，花在最该花的地方

这是系列的第 2 篇。前两篇我们都在和“文档本身”较劲。从下一篇起，视角要变了：我们开始盯着人——那个正在读文档的用户，他到底是谁？有趣的是，你不用发任何问卷，光靠他的阅读行为，就能把他猜个八九不离十。欢迎关注「文档不头疼」。

本文由 AI 协助整理润色

更多用数据打磨文档的方法

文档不头疼

#文档不头疼#Carly聊技术写作#技术传播#问题文档#数据驱动#内容优化