前两天看到一条新闻,心里咯噔了一下。
微软的 Copilot 出了个安全漏洞——用户上传到 OneDrive 的文件,被 AI Agent 在用户没同意的情况下读了出来,部分内容还被泄露给了第三方。
事是国外的事,但我立刻想到一件跟自己有关的:
我这几个月发给 AI 的那些东西,到底去哪儿了?
回头数了下我最近用 AI 的场景——
• 审合同:前阵子接了一份外包合作,对方发来的合同条款密密麻麻,我把整份 PDF 丢给 DeepSeek,让它告诉我"哪几条是坑、哪几条可谈"
• 聊方案:写公众号选题、想标题,跟 DeepSeek 来回聊几十轮
• 查菜谱:晚上做什么菜,问 Kimi
• 整理资料:拍下来的笔记、收到的 PDF、随手存的图片——丢给 AI 让它帮我提取、归纳
这些聊天里有什么?合作方的报价、家里的菜单、各种平时随手收到的文件——以及一些我自己都没意识到的"敏感细节"。
这些数据,AI 厂商怎么处理的?会拿去训练模型吗?我能关掉吗?
我把 4 家国产主流 AI 都翻了一遍:DeepSeek、豆包、Kimi、千问。先看政策原文,再到产品里挨个找开关,最后跑去找客服问。
结果让我意外——真正能关的,只有 2 家。
下面把我翻出来的东西,完整摆给你看。
第一步:4 家政策原文,谁说得最透?
我直接打开 4 家的隐私政策,找跟"训练数据"相关的那几行,对比措辞。
DeepSeek 的说法
直接说"训练",不绕弯。
豆包的说法
也是明说,而且数据类型分得很细——文本、图片视频文件、语音,3 类分开列。这是 4 家里写得最清楚的。
Kimi 的说法
注意这里——没有"训练"两个字,用的是"模型服务优化"。
听起来温柔多了。但意思一样吗?我后面专门为这个问题去问了 Kimi 客服,先按下不表,留个悬念。
千问的说法
千问是 4 家里唯一一家把场景拆开说的——它分成了两种情况:
• 你日常在对话框里聊天发的内容(包括随手丢给它的文件):可能被"随机抽取少部分"用来训练
• 你专门建到「知识库」里的资料:默认不会被拿来训练
这里我得插一句解释——
千问 App 里有一个叫"知识库"的功能:你可以把常用文档、笔记、PDF 上传进去,建成一个你的专属资料库。以后让 AI 回答问题时,它会优先去这个资料库里查。
打个比方就是,对话框 = 你随口跟人聊的话;知识库 = 你专门交给保险柜的档案。千问承诺保险柜里的东西不动用——但对话框里随便聊的,还是有概率被抽中。
措辞最克制、最具体。
把 4 家的政策原文摆在一起:
| 厂商 | 关键措辞 | 一句话翻译 |
|---|---|---|
| DeepSeek | "用于模型训练" | 直接说训练 |
| 豆包 | "用于改进模型效果" | 直接说训练,3 类细分 |
| Kimi | "用于模型服务优化" | 用"优化"代替"训练" |
| 千问 | "随机抽取少部分;知识库默认不训练" | 措辞最克制,分场景说 |
光看政策——豆包写得最透,千问写得最克制,Kimi 最模糊,DeepSeek 中规中矩。
但政策是文字,真正决定我能不能"关"的,是产品里到底有没有那个开关。
我接着挨个翻。
第二步:政策写完了,产品做到了吗?
这一步真的让我意外——4 家在"产品落地"上的差距,比政策上的差距还大。
🟢 DeepSeek:开关有,但措辞悄悄变了
DeepSeek 的设置路径很顺——
一个明确的开关,默认开启,可以一键关掉。
但我盯着这个开关看了几遍,发现一件有意思的事——
政策原文写的是:"用于模型训练"
设置页上写的是:"数据用于优化体验"
同一件事,两种说法。"训练"两个字被隐去了,换成更软的"优化体验"。
这不是错,可能产品团队觉得"训练"听着太重。但作为用户,如果我只看设置页、不看政策原文,我可能根本不会意识到关掉这个开关意味着什么。
DeepSeek 还有两个不错的细节:可以一键导出全部对话记录(7 天有效),可以一键删除全部对话。这两个功能 4 家里只有它最齐。
🟢 豆包:颗粒度最好,但路径写错了一层
豆包是我这次实测里对家长场景最友好的一家。
它的开关不止一个,是 3 个:
• 「文本」用于改进模型效果
• 「图片视频文件」用于改进模型效果
• 「语音」用于改进模型效果
3 个细分开关全部默认开启,但都可以单独关。
为什么这个分类对家长重要?
如果你只是日常聊聊天问问知识,关不关无所谓;但如果你经常给 AI 传文件——合同、孩子作业拍照、试卷扫描——你可以只关掉"图片视频文件"那个开关,其他保留。
这是 4 家里唯一支持这种精细化控制的。
但我要扣豆包一分——它的政策路径写错了。
政策原文里写的是:"设置 → 隐私与权限 → 帮助模型改进效果"。我按这个路径找了两遍都找不到。回退一层才发现,这个开关实际在设置一级菜单的平级位置,不在"隐私与权限"二级菜单里。
不是大问题,但对一个隐私敏感的设置来说——按官方说明找不到,回退一层才看到,这一关有点失礼。
🔴 Kimi:4 家里最不透明的——我跟客服来回 4 个回合
Kimi 这一段,是这次横评里信息密度最大、也最让我心里发凉的。
先说产品里翻设置的过程。我打开 Kimi App,把所有入口都点了一遍:
• 点头像,弹出 5 项菜单(会员计划、关于我们、Language、帮助、设置)
• 点"设置",进入"通用"页,11 个选项(主题、语言、声音、常用语、记忆空间……)
没有任何一个跟"模型训练 / 优化模型 / 数据用途"沾边的开关。
我有点不死心——会不会是我没找对入口?干脆直接去找 Kimi 客服问。来回 4 个回合,每一轮都让我更清楚 Kimi 这家是什么状态。
🔹 第一回合:能不能关?
我问:
客服直接引用了条款:
根据《Kimi 用户服务协议》的相关条款:
【五、知识产权与其他权利】"3. 为了提升您使用本服务的体验,您授予我们一项免费的使用权,以在法律允许的范围内将您输入之内容及反馈用于模型服务优化"
很抱歉无法满足您的需求呢
——白纸黑字"无法满足您的需求"。这是 4 家里我得到的最明确的"不行"。
我追问了一句:"我授予是在没有选择权下的被动授予,你说的'法律允许的范围内',请问具体是什么范围?"
🔹 第二回合:客服建议我自己脱敏
客服回了一句话——这一句让我看完愣了几秒:
这句话翻译过来就是:
挺离谱的。
这背后的产品逻辑我能理解——训练数据流就是这么设计的,关不了就是关不了。但对家长这种使用场景来说,让我"上传前先脱敏"是一个不现实的要求:
合同里哪一段是关键、菜谱里哪一行是隐私、孩子作文里哪个细节会暴露身份——这些日常场景,我都不见得拎得清,更别说还要在上传前一句一句改。
🔹 第三回合:那我删了的文件还会被训练吗?
我换了个问题问:
客服先发了一个协议链接:"您看一下我们的隐私协议哈"。然后跟了一条话术:"很抱歉给您带来不好体验,我们十分重视用户的声音,会提交您的反馈进行内部优化。"
我把整份隐私协议看完了,看完之后跟客服说:
但是并没有解决我对信息安全的担忧。
如果一个非专业人士,看到协议上那么多字估计没多少人可以看懂,在不自觉中将自己的信息用于你们的模型训练而不自知。
这是普通用户最大的问题——
不是不愿意看协议,是看不懂;不是不在意隐私,是不知道自己在哪一行同意了什么。
客服回了一段"Kimi 的数据处理原则",列了 3 条:
2. 尊重网站访问控制:我们严格遵守行业通行的 Robots 协议……
3. 不破解非公开数据:Kimi 不具备且不会尝试绕过任何形式的访问控制机制。
——这 3 条说的是 Kimi 去互联网上抓公开数据的边界。跟我问的"我私下上传给你的文件会不会被训练",完全是两件事。
🔹 第四回合:请不要偷换概念
我把概念给客服重新理了一遍:
我问的是:我主动上传到 Kimi 的私有文件(非公开网络信息),在后台删除后,是否仍会被用于"模型服务优化"?
你回复的"公开来源原则、Robots 协议"针对的是 Kimi 搜索互联网公开信息的场景,与我上传的私有文件完全是两个独立的数据处理场景,请不要偷换概念。
请明确告知:我点击删除后,文件在 Kimi 服务器上是物理删除,还是仅做前端隐藏?删除是否覆盖"撤回用于模型优化的授权"?
到这里,客服没有再回了。
把 Kimi 这一段的事实摆给你看:
• ❌ 产品里没有任何关闭开关
• ❌ 政策措辞含糊(用"优化"代替"训练")
• ❌ 客服书面回复"无法满足您的需求"
• ❌ 客服建议用户上传前自己脱敏——把责任甩回给用户
• ❌ "协议看不懂导致不自觉同意"——客服只回"会提交内部优化"
• ❌ "删除后是否还训练"——客服用爬虫规则回答上传文件的问题
• ❌ 用户指出概念被偷换后,客服没有再回
我不是要在这里黑 Kimi——我自己平时还挺常用 Kimi 查菜谱、做点 PPT。
但这次实测,把我心里的小疙瘩捅破了:
当我把一份合同 / 一份文件传上去时,我没法关闭训练,也没法验证我删了之后它有没有真的不再用——这两件事都只能"信任",不能"控制"。
🟡 千问:政策最克制,但产品里也没开关
千问的设置我翻得最仔细——它有 7 个 tab:通用、界面、模型、聊天、个性化、账号、关于。
挨个看:
• 通用:主题、语言、声音
• 模型:选用哪个版本(Qwen3.6-Plus 等)
• 聊天:导入、导出、归档、删除对话记录
• 个性化:记忆开关、搜索/代码/图像功能开关
• 账号:编辑账户、更改密码、删除账号
没有训练相关开关。
但千问跟 Kimi 不一样——千问政策里专门写了"知识库内容默认不训练"。
也就是说:你专门存到「知识库」那个功能里的资料(文档、笔记、PDF),千问承诺不会拿来训练。
但要注意——这个承诺只对"知识库"里的内容。你在普通对话框里发的东西(哪怕也是文件),还是会被"随机抽取少部分"用来训练。
千问相当于把"敏感档案"和"日常聊天"拆成了两个等级——专门存档的更安全,日常发的还是有概率。
但实测下来一个尴尬的事:这个"知识库"功能在 App 普通对话页面里没有明显入口——大多数用户日常用千问聊天,根本不会去专门建知识库,也就享受不到那个"默认不训练"的承诺。
第三步:4 家定性表,给你拍
把 4 家挨个翻完后,我的最终判断:
| 厂商 | 政策 | 产品开关 | 默认状态 | 我的定性 |
|---|---|---|---|---|
| 🟢 DeepSeek | 明说"训练" | ✅ 有(设置→数据管理) | 默认开 | 基本及格,开关在、能关、措辞软化 |
| 🟢 豆包 | 明说"训练" | ✅ 3 个细分开关 | 全部默认开 | 颗粒度最好,但政策路径写错 |
| 🔴 Kimi | 用"优化"代替"训练" | ❌ 没开关 | — | 唯一不给关,客服书面拒绝 |
| 🟡 千问 | 措辞最克制 | ❌ 没开关 | — | 承诺克制无控制权 |
一句话总结:
能让你主动关掉训练开关的,只有 DeepSeek 和豆包。剩下两家——一家不让你关,一家想给你关但没做开关。
第四步:那现在到底怎么办?
不是要劝大家不用 AI——我自己天天在用。
但用了几个月、翻了 4 家政策、问完客服之后,我自己定了几条规矩。
🏠 给家长的 5 条
1. 给孩子作业、试卷拍照前,把名字遮一下——名字是最容易被记住的标识符
2. 不要把"孩子全名+学校+年级"一次性给 AI——拆开问没事,组合在一起就成了画像
3. 用完一段时间,清一次对话记录——4 家都支持一键清,DeepSeek 还能导出备份
4. 挑工具先看"设置"里有没有训练开关——能关的优先选
5. 别相信"完全本地""绝对安全""你的数据不会上传"这种话术——只要走 API,数据就上传了
💼 给职场人的 5 条
1. 合同、客户清单、报价单——脱敏再喂 AI
我之前审一份外包合同就是这么做的:把甲方公司名换成"A 公司"、把客户名删掉、把具体客户单价改成量级("约 500 万"留下,"5,234,800"打码)。AI 看的是条款逻辑,不是公司是谁——脱敏完一样能给我"哪几条是坑、哪几条可谈"的判断。
2. 财报、预算、薪资表——能用截图就用截图
截图比纯文本风险小一点(部分厂商对图片训练有单独开关)。要文字版的,先把人名 / 部门拆掉——"研发部去年人力成本 800 万"和"张三李四王五年薪明细 XX 万"是两个完全不同的隐私级别。
3. 挑工具先看有没有开关
优先 DeepSeek(设置 → 数据管理 → 数据用于优化体验)和豆包(设置一级菜单 → 帮助模型改进效果)。Kimi 和千问目前都没有用户可关的开关——传敏感文件前自己心里要有数。
4. 传文件前关"文件类"开关
豆包有 3 个细分开关,"图片视频文件"那一个是传合同 / 报价单 PDF 之前必须先关的。如果你只关一个,关这个。
5. 下面这些东西,就算关了开关也别传
未发布的产品方案、人事变动、谁谁要离职、内部矛盾、客户的报价底线、合同里没签字前的金额——这些写在心里、写在公司内网、写给同事都行,就是别写给 AI。
写在最后
做这次横评的初衷不是吓人——是因为我自己用了几个月 AI 之后,心里那个"它会不会偷偷拿我数据"的小疙瘩一直没解开。
翻完 4 家、问完客服、把开关摸了一遍以后,我反而踏实了——
不是因为 AI 厂商都做得很好——4 家里只有 2 家能让我主动关训练,1 家直接告诉我"无法满足您的需求"。
而是因为,当我知道每家的边界在哪、哪些能控制哪些不能,我就知道该把什么东西喂给它、什么东西不该喂。
工具是工具。能用好的前提,是先看清楚它能做什么、不能做什么、答应你什么、做不到什么。
如果你看到这里,今晚回家有 5 分钟时间,做一件事:
打开你常用的那个 AI App → 进设置 → 找有没有"训练 / 优化 / 数据"相关的开关 → 默认是开的,把它关掉。
——以及,永远不要把你自己都不愿意让别人看到的东西,发给 AI。
本文 4 家政策原文截图、产品设置截图、Kimi 客服回复截图均为本人实测。如各家产品后续迭代,以最新版本为准。
觉得有用的话,转发给身边需要的朋友,一起成长~
#AI #Deepseek #豆包 #千问 #Kimi #AI隐私 #数据安全
👆 点击上方「Agent速通指南」关注我
夜雨聆风