上个月一个做医疗数据的朋友找我,聊他们团队用AI的事儿。
他们喜欢拿DeepSeek和Kimi分析脱敏后的患者数据。
我问:用的哪个版本;
他说:Web版,免费的;
我说:你知道你传上去的数据最后去哪儿了吗?
他不说话了。
不是吓唬人。Web版默认会用你上传的数据训练模型。说白了,你公司的客户数据、核心指标、甚至明年要打哪块市场,全在帮别人养AI——跟你一毛钱关系没有。
你可能想说“我脱敏了啊”。
没用。
有人把脱敏后的销售数据上传到公有AI,AI自己扒拉了网上公开信息,把“客户A(已脱敏)”和“北京某医疗公司3月采购额”给串上了。脱敏不等于安全,这俩事儿不划等号。
怎么办?
要么本地私有化部署。Ollama加个开源模型,数据在你自己的电脑里跑,不联网。之前写过教程,主页能翻到。
要么用企业版。现在不少厂商出了企业私有版本,数据不出域。贵是贵,但至少不炸雷。
实在非用公有AI不可,至少定个规矩:什么能传,什么打死不能传。
我见过更离谱的——一家公司的销售直接把客户合同复制粘贴进AI,让人家写摘要。合同上有客户全名、身份证号、采购价。他觉得没什么。
后来数据从第三方漏出去了。
没有后续了,这种事出了也不会有人告诉你。
信息是企业的核心资产,大家在使用新兴技术时需要牢记安全第一,每一个新技术的诞生到普及到成熟都会有一个安全阵痛期。这段时间许多人都不会意识到不专业的使用会带来安全风险,稀里糊涂的就把核心数据泄露了。得到这些信息的受益人是不会告诉你的,甚至还期待接下来你还会有哪些信息出来。
关注老桥,你需要一个懂技术的朋友。
夜雨聆风