点击蓝字
关注我们

全文共计约 2218 字,细读时间约 7 分钟
译者按
2026年5月6日,加拿大隐私监管机构发布对OpenAI旗下ChatGPT的联合调查结果。调查显示OpenAI在其早期模型训练中存在的过度收集、有效同意不足、透明度不充分、信息不准确及个人权利行使机制不完善等问题。值得注意的是,加拿大联邦和省级各监管机构因管辖适用的隐私法的部分规定略有不同,对投诉调查作出了差异化判断。OpenAI也对调查结果作出对应回应,采取对应措施以加强对加拿大个人信息及隐私的保护。

加拿大隐私专员办公室与魁北克信息获取委员会、不列颠哥伦比亚省信息与隐私专员办公室以及阿尔伯塔省信息与隐私专员办公室共同对OpenAI旗下的ChatGPT开展了联合调查,以评估该公司收集、使用和披露加拿大人个人信息的行为是否符合联邦及省级的隐私法律。
概览和主要发现
此次调查重点关注ChatGPT的早期模型,审查了OpenAI如何获取其训练数据,包括公开抓取的内容、授权数据集以及用户交互数据,并审查其是否遵守同意、透明度和数据准确性等关键隐私原则。
监管机构的调查结果凸显了与所收集数据的规模和敏感性、用户同意的充分性等相关问题的隐私担忧。因此,监管机构得出结论,OpenAI最初训练ChatGPT的方式不符合联邦及省级的隐私法律。具体而言,监管机构发现其:
过度收集个人信息:OpenAI在没有采取充分的保障措施防止信息被用于训练其模型的情况下,收集了大量个人信息。这些信息可能包括个人健康状况、政治观点等敏感细节,以及儿童相关信息。
缺乏有效同意和透明度:OpenAI未按照隐私法律要求,就收集个人信息一事取得有效同意。许多用户并不知道自己的数据被收集并用于训练ChatGPT。OpenAI也未明确说明,从公开可访问来源收集的个人信息可能包括来自社交媒体、讨论论坛以及其他类似网站的数据。
事实不准确和虚构的“幻觉”:OpenAI对ChatGPT回复中可能存在的不准确信息提示不足。直到最近,该公司仍未开展评估以验证ChatGPT对用户提示作出的回复中所包含任何个人信息的准确性。
访问、更正和删除:OpenAI未向所有个人提供便捷可及且有效的机制,以便其能够访问、更正和删除自己的个人信息。
缺乏问责:OpenAI在尚未充分处理已知隐私风险、且未建立数据删除规则的情况下发布了ChatGPT。这使个人面临多种风险,包括隐私泄露、信息不准确,以及因提供的个人信息而遭受歧视。
各司法管辖区的差异与调查结果
尽管不列颠哥伦比亚省、阿尔伯塔省和魁北克省的隐私立法被认为与联邦私营部门隐私法律基本相似,但各管辖区均依据其所管辖的具体法律开展了合规调查。由于各机构负责执行的法律存在差异,得出的结论也有所不同。

OpenAI的回应和未来承诺
OpenAI已采取措施,以解决调查报告中提出的部分关切,其中最重要的是显著限制用于训练新版本ChatGPT模型的个人信息和敏感信息的使用。OpenAI还停用了其早期的ChatGPT模型版本,因为这些模型的训练方式违反了加拿大隐私法。
目前驱动ChatGPT的模型是在采用新保障措施后开发和部署的,这些措施通过以下方式帮助改进了其隐私实践:
限制个人信息的使用:OpenAI已实施一款过滤工具,用于检测并屏蔽其模型训练所使用的公开可访问互联网数据和授权数据集中的个人信息,例如姓名或电话号码。该工具显著减少了训练中使用的私人和敏感信息数量。
提高准确性:OpenAI推出了一项新的网络搜索功能。该功能启动后,会针对 ChatGPT 生成的内容进行实时网络搜索并引用具体的网络来源,从而让用户能够独立核实信息。
优化访问权限:OpenAI改进了用户提交访问请求后收到的自动回复电子邮件,更清晰地说明如何访问不同类型的个人信息。
简化更正流程:OpenAI利用网络搜索功能处理更正请求,使模型能够检索有关个人的最新的公开可访问的信息,并在回复中使用这些信息。
加强更正和删除功能:OpenAI已开发了一项技术解决方案,可阻止关于公众人物的特定个人信息出现在模型输出中,从而确保ChatGPT在尊重隐私权的同时,继续提供相关公共信息。
实施数据保留政策:OpenAI已实施正式的数据保留政策和时间表,用以规范与ChatGPT相关的个人信息处理中的信息保留和删除。
未来改进
OpenAI还承诺在特定期限内采取额外措施,以改进透明度、访问机制、数据保留和儿童隐私保护:
【与调查结果报告发布的同时】OpenAI将发布更多信息,说明其隐私实践,包括说明用于训练其模型的内容来源。
【在调查结果报告发布后三个月内】在未登录状态下使用ChatGPT网页版时,OpenAI将在个人输入其首次用户提示词之前发布通知,说明聊天内容可能会被审查并用于训练模型,并建议用户不要分享敏感信息。
【在调查结果报告发布后六个月内】OpenAI将让用户更易于理解和使用其向请求获取个人信息的用户提供的数据导出功能。同时OpenAI还将更清晰地说明用户若想质疑所提供信息的完整性、准确性或性质,可以通过哪些途径提出异议。
【在调查结果报告发布后六个月内】OpenAI将向相关机构确认,其已对未来将被停用并仅作为历史参考使用的数据集实施强有力的保护措施,以确保这些数据集不会被用于当前的模型开发。该公司还将定期审查是否仍需保留这些数据集。。
【在调查结果报告发布后六个月内]】OpenAI将测试针对公众人物的未成年家庭成员(其本人并非公众人物)的保护措施。相关保护措施旨在确保模型拒绝处理有关其姓名或出生日期的请求。
OpenAI将向OPC及其省级合作伙伴提交季度报告,以证明其遵守上述承诺,直至所有承诺均已得到履行。
对组织的主要启示
各组织有责任确保其使用人工智能的产品和服务符合现行的国内(包括联邦和省级)及国际隐私法律和监管要求。
《负责任、可信赖并保护隐私的生成式人工智能技术原则》(Principles for responsible, trustworthy and privacy-protective generative AI technologies)可为在加拿大境内开发、提供或使用生成式人工智能的组织提供支持。
END
编译 | 缑芋灵
排版 | 缑芋灵
审核 | 裴 轶

夜雨聆风