笑看数据那些事:AI还是个工具








整点干货,数据小笑话
编码标准的巴别塔
数据标准委员会花费6个月制定了《 master_data_code_standard_v3_final_rev2_真的final.xlsx 》,规定了客户编码规则。
然后发现供应商系统使用了16位数字码,CRM系统使用了UUID,旧ERP用了拼音首字母缩写,而那个关键的Excel数据源用的是”客户简称+日期+_备份”。
数据集成工程师学会了用禅坐来平复心情。
货币单位的百万差错
数据标准规定:”金额单位统一为元,保留两位小数。”
财务系统严格遵守,录入了一笔 1000000.00 元的采购订单。
实际上他们想表达的是100万元,但系统显示的是1,000,000元,也就是100万元。
等等,好像哪里不对?
半年后审计发现,该公司在数据标准实施后的第一年,因为”元”和”万元”的混淆,多缴了企业所得税相当于一个数据标准团队的全年预算。
手机号的11位执念
数据标准强制要求:”手机号必须是11位数字,且以1开头。”
业务经理愤怒地冲进会议室:”那我们的VIP客户用座机怎么办?!”
标准委员会冷静地回答:”那就让他们去办手机号,这是数字化转型的代价。”
一周后,客服部发现20%的VIP客户变成了”13800000000″、”13999999999″和”11111111111″。
数据标准文档命名为 数据标准规范_v1.0,
一周后出现了 v1.1_修订版,
然后是 v1.2_最终版、v1.3_最终版_不改了、v2.0_beta_临时过渡、v1.5_回滚版。
数据质量监控规则问:”我该按哪个版本执行?”
所有文档同时回答:”以最新的为准。”
“哪个是最新的?”
“打开看看修改日期。”
“它们都是今天修改的。”
“若我遇难:
删除所有TODO注释
把项目经理聊天记录刻进区块链
在GitHub建衣冠冢(star过万自动立碑)“
关注公众号,获取数据治理相关资料地址。

夜雨聆风