Excel 脱敏脚本,不是为了省事,而是为了保持替换一致

脚本不是替你判断风险，而是按已经确定的替换表，帮助同一对象在不同文件里保持同一个代号。

第53篇讲了一个前置动作：

给 AI 看经营材料前，先做一张脱敏替换表。

但很多人做到这一步以后，会遇到另一个问题：

如果 Excel 文件很多，字段很多，版本也很多，手工替换就很容易乱。

同一个客户，在一个文件里叫客户A，在另一个文件里可能被改成客户X。

同一个项目，在预算表里叫项目P，在毛利表里可能变成项目甲。

还有一些真实名称，可能藏在备注列、辅助列、隐藏 sheet 或文件名里。

所以，脱敏脚本真正有价值的地方，不是“省事”。

而是保持替换一致。

手工替换最容易出三类问题。

第一，同一个客户在不同文件里变成不同代号。

第二，同一个项目在不同表里出现不同写法。

第三，某些角落还残留真实名称。

如果脱敏不一致，后面让 AI 做跨文件核对时，就会把本来同一个对象当成多个对象。

这不是效率问题。

这是后续分析会不会乱的问题。

脱敏脚本不应该替你判断哪些资料能不能给 AI。

它也不应该替你决定哪些金额可以保留，哪些客户可以公开，哪些口径会影响分析。

这些判断仍然要由人做。

脚本能做的事情更窄：

读取替换规则，找到需要替换的内容，输出脱敏版文件。

换句话说：

脚本执行规则。

人决定规则。

如果规则本身没想清楚，脚本只会更快地把混乱复制到更多文件里。

在写脚本前，先不要急着打开代码工具。

更重要的是先分清三类文件：

文件	作用	谁维护
原始材料	内部真实数据	人
替换表	原始值与代号	人
脱敏版	给 AI 的材料	脚本输出后人复核

这三类文件不能混在一起。

原始材料留在内部。

替换表留在本地或内部安全位置。

给 AI 的，只是已经替换后的脱敏版材料。

最小替换表，可以先很简单：

原始值	替换值	字段类型	是否上传
A公司	客户A	客户	否
张某	负责人1	人员	否
项目甲	项目P	项目	否
368万	300-400万	金额	否

这张表不是给 AI 看的。

它是给本地脚本执行替换用的，也是给人复核用的。

如果替换表里同一个客户有两个写法，脚本也会跟着混乱。

所以在脚本之前，先把替换表整理干净。

脚本适合处理规则明确的替换。

比如：

客户名称替换成客户A；
人员姓名替换成负责人1；
项目名称替换成项目P；
精确金额替换成区间；
部门名称替换成部门M。

这些事情如果手工做，容易漏。

如果用脚本做，至少可以保证同一个原始值在所有文件里被替换成同一个代号。

这就是脚本的主要价值。

不是聪明。

是稳定。

但脚本不适合替你做风险判断。

比如：

哪些金额可以保留？

哪些客户可以公开？

哪些口径一改就会影响分析？

哪些文件可以上传外部 AI？

这些都不是脚本应该决定的。

脚本只负责按规则替换。

规则是否合理，仍然要由人来确认。

脚本跑完，不代表脱敏结束。

输出的脱敏版，至少要检查四件事：

第一，有没有真实名称残留。

第二，代号有没有前后一致。

第三，金额区间是否合理。

第四，脱敏后还能不能分析。

尤其是第四点很重要。

如果脱敏完以后，客户关系、项目阶段、金额大小、指标方向都看不出来，后续 AI 也很难帮你做整理和核对。

如果要让 AI 参与，也建议只让它看脱敏版。

它可以帮你检查：

是否还有疑似真实名称；
是否有代号不一致；
是否有字段缺失；
是否有口径看不懂。

但不要让它：

还原真实对象；
保管映射关系；
判断资料能不能外发。

AI 可以查漏。

边界仍然要由人控制。

Excel 脱敏脚本，不是为了省事。

而是为了让同一个对象，在所有文件里保持同一个代号。

最小流程可以只有五步：

复制原始 Excel。

整理替换表。

本地脚本执行替换。

人工检查脱敏版。

再交给 AI 做整理核对。

这条顺序不能反过来。

先本地脱敏。

再进入 AI。

脚本执行规则。

AI 检查漏项。

人保留映射和判断。