AI助手敏感数据安全方案 |第三课

课程来源：Handling Sensitive Data with Cloud and Local AI - AI assistants: Secure options for sensitive data 讲师：Ronny
笔记整理自 LinkedIn Learning 课程。

一句话总结：通过合理配置AI助手、实施数据匿名化、使用LLM代理层，可以有效降低使用ChatGPT、Claude等AI服务时的敏感数据泄露风险。

第一部分：AI即服务的数据隐私风险

当使用ChatGPT、OpenAI API、Anthropic Cloud、Microsoft Copilot、Google Gemini等AI工具时，数据隐私面临两个主要挑战：通过API或助手向第三方暴露数据，以及模型可能使用用户数据改进自身。

为应对这些风险，需要采取三方面措施：配置工具以减少数据暴露、向用户或相关方透明说明数据使用情况、建立组织层面的数据安全策略。这些措施共同构成了保护敏感信息的基础防线。

核心风险提示：使用任何第三方AI服务都意味着您的数据会离开组织边界，即使服务商承诺不存储数据，也无法完全排除在传输和处理过程中的安全风险。

通过合理配置AI助手的隐私设置，可以显著降低数据泄露风险。以下是主流AI工具的关键配置建议：

设置项	建议状态	说明
Personalization/Memory（记忆功能）	关闭	保持对话隔离，防止数据在对话间泄露
Recording Mode（录音模式）	关闭	不引用录音历史，避免语音数据泄露
Web Search（网络搜索）	可关闭	根据实际需求决定，关闭可减少数据暴露
Remote Browser Data（远程浏览器数据）	关闭	避免浏览器数据被AI工具访问
Improve model for everyone（改进模型）	关闭	防止模型暴露你或用户的数据
定期删除聊天记录	启用	查看保留策略，按组织需求管理历史记录

核心建议
：想要更多隐私就别用免费工具。付费服务通常提供更多隐私功能，如企业版API通常包含更严格的数据处理协议。

数据匿名化是用占位符或匿名数据替换个人身份信息的技术手段。这是保护个人数据的有效方法，特别适用于与第三方AI服务交互的场景。

Presidio Analyzer是行业常用的匿名化工具，由Microsoft开发并开源。它能够识别多种类型的个人身份信息（PII），如姓名、电话号码、邮箱地址、身份证号等。

使用前安全建议：

LLM代理是位于语言模型和用户/团队成员之间的软件层，作为中间件管理和控制对AI服务的访问。

liteLLM提供开源工具集和企业版，支持Docker部署，主要功能包括：

安全最佳实践：通过代理层与AI服务通信比直接调用API更安全，支持本地模型和外部API的统一管控，是组织级AI安全架构的核心组件。

liteLLM作为代理层提供的安全优势体现在三个方面：