脚本不是替你判断风险,而是按已经确定的替换表,帮助同一对象在不同文件里保持同一个代号。

第53篇讲了一个前置动作:
给 AI 看经营材料前,先做一张脱敏替换表。
但很多人做到这一步以后,会遇到另一个问题:
如果 Excel 文件很多,字段很多,版本也很多,手工替换就很容易乱。
同一个客户,在一个文件里叫客户A,在另一个文件里可能被改成客户X。
同一个项目,在预算表里叫项目P,在毛利表里可能变成项目甲。
还有一些真实名称,可能藏在备注列、辅助列、隐藏 sheet 或文件名里。
所以,脱敏脚本真正有价值的地方,不是“省事”。
而是保持替换一致。

手工替换最容易出三类问题。
第一,同一个客户在不同文件里变成不同代号。
第二,同一个项目在不同表里出现不同写法。
第三,某些角落还残留真实名称。
如果脱敏不一致,后面让 AI 做跨文件核对时,就会把本来同一个对象当成多个对象。
这不是效率问题。
这是后续分析会不会乱的问题。

脱敏脚本不应该替你判断哪些资料能不能给 AI。
它也不应该替你决定哪些金额可以保留,哪些客户可以公开,哪些口径会影响分析。
这些判断仍然要由人做。
脚本能做的事情更窄:
读取替换规则,找到需要替换的内容,输出脱敏版文件。
换句话说:
脚本执行规则。
人决定规则。
如果规则本身没想清楚,脚本只会更快地把混乱复制到更多文件里。

在写脚本前,先不要急着打开代码工具。
更重要的是先分清三类文件:
这三类文件不能混在一起。
原始材料留在内部。
替换表留在本地或内部安全位置。
给 AI 的,只是已经替换后的脱敏版材料。

最小替换表,可以先很简单:
这张表不是给 AI 看的。
它是给本地脚本执行替换用的,也是给人复核用的。
如果替换表里同一个客户有两个写法,脚本也会跟着混乱。
所以在脚本之前,先把替换表整理干净。

脚本适合处理规则明确的替换。
比如:
客户名称替换成客户A; 人员姓名替换成负责人1; 项目名称替换成项目P; 精确金额替换成区间; 部门名称替换成部门M。
这些事情如果手工做,容易漏。
如果用脚本做,至少可以保证同一个原始值在所有文件里被替换成同一个代号。
这就是脚本的主要价值。
不是聪明。
是稳定。

但脚本不适合替你做风险判断。
比如:
哪些金额可以保留?
哪些客户可以公开?
哪些口径一改就会影响分析?
哪些文件可以上传外部 AI?
这些都不是脚本应该决定的。
脚本只负责按规则替换。
规则是否合理,仍然要由人来确认。

脚本跑完,不代表脱敏结束。
输出的脱敏版,至少要检查四件事:
第一,有没有真实名称残留。
第二,代号有没有前后一致。
第三,金额区间是否合理。
第四,脱敏后还能不能分析。
尤其是第四点很重要。
如果脱敏完以后,客户关系、项目阶段、金额大小、指标方向都看不出来,后续 AI 也很难帮你做整理和核对。

如果要让 AI 参与,也建议只让它看脱敏版。
它可以帮你检查:
是否还有疑似真实名称; 是否有代号不一致; 是否有字段缺失; 是否有口径看不懂。
但不要让它:
还原真实对象; 保管映射关系; 判断资料能不能外发。
AI 可以查漏。
边界仍然要由人控制。

Excel 脱敏脚本,不是为了省事。
而是为了让同一个对象,在所有文件里保持同一个代号。
最小流程可以只有五步:
复制原始 Excel。
整理替换表。
本地脚本执行替换。
人工检查脱敏版。
再交给 AI 做整理核对。
这条顺序不能反过来。
先本地脱敏。
再进入 AI。
脚本执行规则。
AI 检查漏项。
人保留映射和判断。


夜雨聆风