OpenAI 开源实用本地隐私过滤工具Privacy Filter

合同、工单、客服记录、用户反馈……这些文本里藏着大量个人信息：姓名、手机号、邮箱、地址、账号密码。

一旦这些数据进了大模型的训练集，或者被写进日志文件，或者被当成普通文本传给第三方 API——麻烦就来了。

OpenAI 最近在 Hugging Face 上开源了一个专门处理这类问题的模型：Privacy Filter。

效果可看视频：

找出文本里的隐私信息

输入一段文字，模型会逐词扫描，把属于隐私范畴的内容标注出来，返回带标签的结果，或者直接替换成占位符。

目前能识别八类信息：

private_person：私人姓名
private_phone：电话号码
private_email：邮箱地址
private_address：家庭或工作地址
private_url：个人链接
private_date：日期（在特定语境下构成隐私）
account_number：账号编号
secret：密钥、密码、token 等敏感凭证

用 Transformers 跑起来很简单：

from transformers import pipeline

classifier = pipeline("token-classification", model="openai/privacy-filter")
classifier("My name is Alice Smith and my email is alice@example.com")

输出的结果会把"Alice Smith"标为 private_person，把邮箱标为 private_email，置信度都接近 1。

模型很小，总参数 15 亿，但活跃参数只有 5000 万——这是混合专家架构（MoE）带来的好处，每次推理只激活一小部分参数。实际跑起来的资源消耗远低于同体量的 dense 模型，笔记本能跑，浏览器里也能跑（官方提供了 WebGPU demo）。

上下文窗口 128K。 处理长合同、长文档不需要自己切段再拼接，一次送进去就行。对于需要高吞吐量处理大批文本的场景，这个设计直接减少了工程复杂度。

推理方式不是逐词生成。 底层是把一个自回归预训练模型改造成了双向 token 分类器，推理时一次 forward pass 处理整段输入，然后用 Viterbi 解码算出每个词的标签。这意味着延迟低、速度快，比用通用大模型做 prompt 提取隐私字段要高效得多。

精度和召回可以在运行时调节。 通过调整解码参数，可以让模型偏向"宁可多标也别漏"（高召回）或者"宁可少标也别误报"（高精度）。具体怎么设置，取决于业务对两种错误哪个更敏感。

协议是 Apache 2.0。 可以商用，可以本地部署，可以在自己的数据上微调，数据不用出网。

局限性

不常见的姓名、特定地区的命名习惯、带敬称的间接指代，有可能漏掉。公共机构名称、地点名词、常见词在语境模糊时有可能被误标。混合格式文本（比如夹杂大量标点和排版符号的文档）里，标注的边界可能出现偏移。对非英文内容的支持有限，官方只提到做过"部分多语言鲁棒性评估"，没有给具体语言的性能数据。

最重要的一条：它是数据脱敏辅助工具，不是合规保证。 官方明确表示，不建议把它当作唯一的隐私防线，医疗、法律、金融、政府等高敏感场景尤其要配合人工审核。

适合什么场景用它

几个比较典型的落地方向：

训练数据清洗。 在把内部文本送去训练或微调模型之前，先跑一遍过滤，避免把真实个人信息喂进去。

日志脱敏。 系统日志里经常混入用户输入的原始内容，用它在落盘前做一层过滤。

文档处理流水线。 合同、申请表、客服记录在流转之前自动打码。

本地私有化部署。 对数据出境有严格要求的团队，这个模型可以完全在内网运行，不依赖任何外部 API。

模型地址

https://huggingface.co/openai/privacy-filter https://huggingface.co/spaces/webml-community/privacy-filter-webgpu

- END -

如果你觉得这篇文章不错，别忘了点赞、在看、转发给更多需要的小伙伴哦！