
现在利用AI能够方便的辅助我们做数据分析,例如ABI智能助手可以直接生成完整的分析报告,极大地提升了我们的效率。
不过一切智能分析的前提,都依赖于干净、规范的数据基础。如果原始数据中混入了不规范的字符、格式或错误值,那么AI也难以施展拳脚。
今天介绍一个在Power Query中高效查找、集中处理错误数据的思路,有效地识别、隔离和报告这些错误,从而简化数据清理流程,为高质量的自动化分析铺平道路。
以下面这个订单表为例,当把它导入到PowerBI并加载到模型中,可以看到提示有错误,为什么会出现这个问题呢?

出现这种错误,一般是由于数据源不规范导致的,那么如何快速定位到错误具体在什么地方?
可以通过点击上述界面中的“查看错误”,进入PowerQuery中查看具体是哪些行存在错误。

这个错误表的每一行至少都有一个单元格存在Error,点击Error可以看到错误原因,比如这个:

这一列是销售额,但是数据中带有文本单位“元”,无法直接转换为数值型,所以会报错。
知道了哪些行存在错误,如何解决呢?
如果这些错误行并不重要,可以直接删除掉所有的错误行,只需要点击该表左上角的得按钮,选择“删除错误”即可。

不过大部分情况下,并不能直接删除,还是需要查找错误原因并修正错误数据的。
在错误表中,可以逐列查找Error单元格,通过提示来修正,不过这样效率太低了,我们可以在错误表中,选中第一列行号列,右键“逆透视其他列”:


就能将所有的错误单元格全部显示在一起了:

通过这个表,第一列是源数据的行号,第二列是源数据的列名,点击第三列的每个error可以查看错误原因,这样就非常方便的帮助我们定位错误,并进行相应的调整。
可以在源数据中对数据进行更改,也可以导入到PowerQuery之后,先不要转换数据类型,把错误的单元格数据替换成正确的格式后,再把字段转换成正确的数据类型。
数据表中的Error单元格解决完之后,不存在错误了,系统自动生成的错误表也会变成空表,不想要的话可以右键该表删除。
通过上述步骤,可以帮助我们快速识别、整理、修正不规范的数据,这种方法不仅提高了效率,还增强了用户对数据质量的掌控力,是处理复杂数据集时不可或缺的实用技巧。
PowerBI星球618活动进行中…
加入立省50,不要错过哦~
进入PowerBI星球社群,不仅能解锁ABI智能助手、ABI Chat,ABI Report,还能获取海量 PowerBI 教程、AI应用、专属答疑等优质资源,快速提升PowerBI分析技能,详见:真正把AI用到BI上,这可能是门槛最低的一种方式

夜雨聆风