免费、断网可用的法律脱敏,出WPS插件了!
元典脱敏 · 智能文档脱敏系统
网页版WPS插件版单机版
这不是一个人的问题。今年以来,身边越来越多的律师在尝试搭建自己的 AI 知识库。把合同模板、尽调报告、判决书喂给 AI,让它记住你的办案风格——听起来是理想状态。
但所有人都卡在同一个环节:材料里全是敏感信息——姓名、身份证号、公司名、涉案金额。这些东西,你不敢上传到任何云端。
拿去喂 AI?泄露风险摆在那。不喂?别人在用 AI 提效,你在手工一份份改。想用 AI 的人,反而成了离 AI 最远的人。
拆开看,缺的环节就一个——脱敏。把敏感信息盖住,保留法律结构和文书内容,再拿去建库,问题就解了。
所以我们打造了——元典脱敏。这篇文章把三个版本都实测了一遍,把结果写出来。
最新上线:在 WPS 里点一下,脱敏就完成了
法律人 90% 的文书工作在 WPS 里完成。这是我们先做 WPS 插件的理由。
如果每次脱敏都要打开浏览器→上传文件→等待处理→下载结果→再贴回 WPS,这个"切换缝隙"迟早会让你不想用它。工具本身挺好,就是懒得打开。
WPS 插件的思路很简单——把脱敏变成写文书过程中的"一个动作",不是"一个流程"。
实际用起来是这样的:你在 WPS 里写着一份合同,右侧边栏打开元典脱敏,选中要处理的文本,点击"脱敏"。身份证号、手机号、银行卡号这些常见敏感信息自动覆盖。结果直接在文档里呈现。
不需要切出 WPS,不需要打开网页,不需要上传下载。全部在 WPS 内部完成。

WPS 侧边栏打开元典脱敏,选中文本,点击脱敏
处理完成的效果——原文档与脱敏后逐段对照:
![]() 脱敏前 | ![]() 脱敏后 |
日常的合同、函件、起诉状里最常见的个人信息脱敏场景,它覆盖得干净利落。如果需要更深度的自定义规则、AI 语义识别——WPS 版主打快进快出;完整功能在下面这个版本。
完整版:网页版支持双引擎 + 自定义规则
网页版是元典脱敏功能最全的版本。上线时间最长、规则生态最成熟、用户量最大——注册用户超过 1500 人,自定义规则累计 240+ 条。下面逐个拆它的核心能力。
① 正则 + AI 双引擎,各管各的
单用规则匹配或者单用 AI 识别,都能做脱敏——但都会漏。
纯正则擅长固定格式:身份证号、手机号、银行卡号——有规律的东西,正则又快又准,一个都不会放过。但"茂源公司""被上诉人""张三"——这些需要看上下文的,纯规则就漏了。你不能写一条正则说"匹配所有人名"。
网页版的做法是两套引擎并行跑:
- 正则引擎
— 按内置规则+自定义规则,固定格式全覆盖 - 本地 NER 引擎
— 基于 ONNX 模型本地运行,识别人名、机构、地址
规则兜住格式、AI 兜住语义,互为补位。两套引擎各自独立开关,实测同时跑效果最好——单跑一套一定会漏。

上传文档后,双引擎自动识别敏感信息——人名、机构、金额全部覆盖
额外说一句 NER 模型的准确率——我们在法律文书标注测试集上持续迭代,实体级准确率从初版的 86.74% 优化到了98.40%。这是针对法律文书做了专门训练的,不是随便找个开源模型套上就完事。
② 自然语言生成正则——不用找开发
规则谁来写?传统流程里,法务发现"有个新格式的编号需要脱敏",要提需求给 IT → 等排期 → 开发写正则 → 测试 → 上线。一个小规则迭代周期是几天到一周。
在元典脱敏里,这个流程被压缩成了一句话:用自然语言描述你要匹配什么,AI 自动帮你生成正则。

输入自然语言描述 → AI 自动生成正则 → 在线测试 → 直接启用
不需要会正则语法,不需要找开发排期。目前用户已通过这个方式自定义了 215 条脱敏规则,加系统内置 25 条,规则库总计 240 条。
③ 可逆——脱敏不是销毁,内审还能还原
这是法律场景特有的需求。脱敏不是销毁信息。脱敏后的文档要流转、要建库——但如果审阅时需要看原文呢?
元典脱敏每次处理都自动生成一份"原文 ↔ 占位符"映射字典:
脱敏后的文档拿去建库、分析、流转。需要时"一键还原",原文恢复。映射字典可导出为文件,由有权限的人员离线保管。
内审用、复核用、跟客户确认用——都留了一扇门。

映射字典展示 + 一键还原原文
④ 批量 + 多格式
面对真正案件材料时,你遇到的不是"一份合同",而是"几十份卷宗"。元典脱敏支持最多 10 个文件批量上传,统一规则跑完,ZIP 打包下载。Word、PDF、txt、主流图片格式全部支持。从原来按小时计的工作量,压缩到十几分钟出结果。
内部效率测算:传统人工处理一份文档约 10 分钟,同等量级用元典脱敏批量完成,提效 10 倍以上。
网页版体验入口
tuomin.ailaw.cn
免费使用
再加一层保障:本地版断网可用
有些场景对安全要求更高:涉密案件、律所网络政策严格、或者单纯就是不放心任何"经过公网"的操作。
单机桌面版。跟网页版的唯一区别:不需要任何网络连接。
安装一次,所有推理在本机完成。NER 模型用 ONNX Runtime 轻量推理,不需要 GPU,不需要外网。装在一台没有联网的笔记本上也能跑。

单机桌面版——完全离线运行,数据不离开你的电脑
文件从头到尾没有离开过你的电脑。
网页版走内网闭环,单机版彻底离线。两种形态——看你需要哪一级的安全保障。目前单机版累计安装几百次,高保密场景的需求是真实存在的。
体验过的用户怎么说
"之前自己手搓过一个脱敏脚本,纯关键词替换那种,遇到人名就没办法,得手动补名单。元典这个内置了一套识别规则,人名、机构、金额它能自己认出来,比我自己写的干净太多了。"
——用户反馈
"手搓脚本"这个事其实很普遍——不少律师都在自己写小工具来辅助工作。但自己做的东西在识别能力上终究有限,这就是我们花大力气做法律文书专用 NER 模型的原因。
三个版本怎么选
三个版本不是替代关系,是不同场景选不同工具:
日常写文书→WPS 插件版,不跳出
复杂脱敏、团队协作→网页版,功能最全
涉密材料、断网环境→单机版,离线保障
把 AI 用起来的第一步
回到开头那个问题:律师想用 AI 分析自己的案子,但数据不敢上传。元典脱敏给的答案是——在数据进入 AI 之前,先把它脱干净。
从最早的网页版到最新上线的 WPS 插件版,核心逻辑一直没变:在保障安全的前提下,不牺牲效率。
之前我们发了「法律幻觉校验器」——解决 AI 输出端的问题(瞎编法条)。元典脱敏解决输入端的问题(数据不敢喂)。两个凑齐,才是安全的 AI 工作流:
脱敏 → 喂 AI → 校验输出 → 出报告
立即体验
tuomin.ailaw.cn
免费使用 · 无需配置
夜雨聆风
