最近有个任务压着我:
部门在跑一个智能推送系统,覆盖了十几个客服场景,每天都会抽检一批推送消息,记录"场景识别准不准"和"问题有没有解决"。数据就是这样一张表——

📊 【截图1:原始Excel】 日期 / 场景名称 / 抽检消息数 / 场景准确率 / 问题准确率
表不复杂,但要从这张表里读出"这段时间到底怎么样""哪些场景在进步""哪些在退步""下一步该盯哪里"——按以往的方式,我得先筛选、分组、算加权平均、做趋势对比、写结论……少说两个小时打底。
这次我换了一个做法。
第一步:告诉AI我要什么
我只说了一句话:
"把这份报告整理一下,格式更美观,阐述更清楚,先说3天的情况,再说总体的情况。"
没有模板,没有格式要求,没有告诉它用什么图表,没有说配什么颜色。
结果它交给我一个完整的HTML报告:渐变蓝色封面、KPI卡片、进度条可视化、绿橙红三色状态徽章、行动建议优先级表。
我只改了一个字都没有。
第二步:换数据,再来一次
项目进展了,数据更新了。这次我有了完整的Excel样本文件。我说:
"分析最近5天的,指标样式都保持一致,只是数据范围发生变更。"
注意:我没有重新描述格式。 它自己记住了上一版的所有样式,只把数据换了进去。
从读取Excel、算加权准确率、找对比基准,到输出完整报告——整个过程不到五分钟。
第三步:我开始追问
有了数据基础,我的需求开始细化:
"分析最近5天的vs上一个5天的。"
它把全部数据按时间拆成两段,每个场景都算出了对比差值,精确到0.1pp,然后用↑↑↓↓的方式标出变化方向。
"再分析最近5天的vs早期整体。"
又换了一次时间段切割,依然是同一套样式,数据范围不同,结论自然也不同。
整个过程,我总共说了四句话,拿到了四份报告。
它到底做了什么?
很多人以为AI做报告就是"把数字填进模板"。我来说说它实际做了哪些事:
① 数据读取与清洗 Excel里的日期是序列号格式(比如46120),它自动转成了"2026-04-08";空值自动补0,没有报错,没有跳过。
② 加权计算,不是简单平均 13个场景的抽检量差异很大——流量包397条,固话呼叫转移只有6条。它用抽检量做权重,算出的整体准确率才是真实水平,而不是把13个数字加起来除以13。
③ 主动识别异常 我从没说过"帮我找异常"。但报告里它自己标出来了:
🔴 国际漫游:问题准确率骤降45.7pp
早期这个场景是全场双优标杆(场景86.3%,问题83.2%),近5天问题准确率跌到了37.5%。它不仅标了出来,还给出了可能的原因方向:"怀疑为模型版本回退、知识库更新断档或新增场景分流影响"。
④ P0/P1/P2优先级行动建议 最后一张表不是罗列问题,而是给出了每个场景的具体行动方向——哪个本周必须查、哪个下周跟进、哪个保持观察。
最终效果长这样
📊 【截图2:报告封面 + KPI卡片】 加权场景准确率 75.6% ↑+24.5pp / 加权问题准确率 55.2% ↑+12.1pp
📊 【截图3:各场景进度条排行榜】 13个场景按准确率降序排列,每行都有场景准确率进度条 + vs早期差值 + 问题准确率 + 状态标签
📊 【截图4:结论三色卡片】 绿色:整体大幅跃升 / 橙色:场景识别≠问题解决 / 红色:国际漫游紧急预警
📊 【截图5:早期基准排行榜】 对比参照,直观看到"哪些场景是从哪里起步的"
📊 【截图6:综合结论 + 优先级行动建议表】 P0/P1/P2三级,场景、问题、建议行动一一对应
说几句真心话
我用AI做这件事之后,想明白了一个区别:
有两种工作,一种是"机械的",一种是"判断的"。
机械的工作是:读数据、算公式、做排版、写模板结论。这部分,AI比我快,比我准,比我耐心。
判断的工作是:这个结论对不对?这个异常要不要重视?这个建议落地了吗?这部分,AI给的是参考,最终拍板还是我。
以前我花两个小时,大部分时间都用在了机械的部分。现在那部分交出去了,我可以把时间放在真正需要动脑子的地方。
这不是AI替代我,这是AI帮我做了那部分我本来就不该亲自做的事。
哦,忘记告诉你用的哪个AI工具了,还是我的老朋友:WorkBuddy。(想了解的,可以看看我之前的公众号文章)
如果你也有类似的数据分析需求,欢迎评论区聊聊你的场景及你用的AI工具。
夜雨聆风



