所谓 “AI投毒”,是向人工智能大模型的训练数据中,掺入伪装成正常样本恶意数据或虚假信息,进而影响模型判断、操纵输出结果。
“投毒者” 可以批量制造虚假网页、新闻,让AI在抓取数据时一并 “吞下”,在不知不觉中 “学歪”,最终固化为针对特定问题的 “标准答案”;也可以在模型中植入隐蔽的后门指令,一旦触发特定关键词就输出预设信息。
这种 “看不见的污染” 轻则影响体验,重则误导决策。
比如AI推荐购物,它可能引导你购买被包装出来的 “爆款”;
向AI咨询医疗建议,它可能引用虚假病例,给出危险的治疗方案……
在医疗、金融等关键领域,这种风险尤其值得警惕。
随着人工智能深度融入公众日常生活,一旦模型给出的回答总是隐含歪曲事实的信息,便会潜移默化误导公众认知,放大偏见、制造混乱,甚至危及国家安全。
为什么 “AI投毒” 在今天变得如此容易?
首先,数据本身越来越复杂,大模型依赖对海量数据的学习训练,各种数据混杂在一起,很难做到完全可控可信,一旦缺乏严格的核查机制,就会给 “投毒” 留下空间。
其次,“AI投毒” 门槛较低,不法分子借助GEO (生成式引擎优化)工具,短时间内便能批量生产高权重虚假内容,成本极低、隐蔽性强。
数据更可信、规则更清晰、责任更明确,人工智能才能真正成为值得信赖的重要工具,为经济社会高质量发展创造更大价值。
夜雨聆风