Sci. Adv. | 有偏见的AI写作助手会改变用户对社会议题的态度-夜雨聆风

Sci. Adv. | 有偏见的AI写作助手会改变用户对社会议题的态度

论文卡片

题目：有偏见的AI写作助手会改变用户对社会议题的态度 (Biased AI writing assistants shift users’ attitudes on societal issues)

作者：Sterling Williams-Ceci, Maurice Jakesch, Advait Bhat, Kowe Kadoma, Lior Zalmanson, Mor Naaman

通讯单位：康奈尔大学 (Cornell University) 等

DOI：10.1126/sciadv.adw5578

30s速读

这项研究通过两项大规模实验发现，当人们使用提供有偏见自动完成建议的AI写作助手时，他们的态度会不知不觉地向AI的立场靠拢。这种影响不仅显著，而且比直接阅读相同的偏见文本更强烈。最令人担忧的是，大多数用户完全没有意识到自己受到了影响，且事前的警告或事后的提醒均无法有效消除这种态度转变。这意味着AI助手可能成为一种隐蔽的操纵工具，威胁用户的思想自由。

摘要

由大型语言模型（LLM）驱动的人工智能（AI）写作助手越来越多地被用于在人们撰写文本时提供自动完成建议。本研究通过两项大规模的预注册实验（N = 2582），调查了这些助手是否能影响用户的态度。结果显示，当参与者在撰写关于重要社会议题的文章时使用提供有偏见建议的AI助手，他们在任务后表达的态度显著向AI的立场收敛。然而，大多数参与者并未意识到AI建议的偏见及其对自身态度的影响。此外，AI写作助手的影响力强于以静态文本形式呈现的类似建议，表明这种影响不能完全归因于信息可及性的增加，而与“行为影响态度”的机制有关。最后，研究发现，无论是在暴露前还是暴露后警告参与者助手的偏见，都无法减轻态度转变的效果。

研究背景

AI的普及与潜在风险： 基于LLM的AI写作助手（如智能回复、自动完成功能）已广泛集成到电子邮件、文档编辑器等日常交流工具中。已知AI会复制并强化人类偏见，但其对人类认知的微妙影响尚不明确。
研究空白： 以往研究多关注AI在显性语境下的说服能力（如生成说服性文章），但忽略了AI通过自动完成建议这种更间接、隐蔽的方式塑造用户认知的潜力。
理论依据： 心理学中的“行为影响态度”范式认为，人们的行为（如写作）可以反过来改变其态度。AI建议通过引导用户写出特定观点，可能触发这一机制，从而在用户无意识的情况下改变其信念。

创新点与实验结果

创新点：

隐蔽性影响验证： 首次确凿证明了AI写作助手的自动完成建议能在用户无意识的情况下改变其对社会议题的态度，这是一种比传统说服更隐蔽的操纵形式。
机制区分： 通过设置“静态文本”对照组，证明了AI的影响不仅仅是因为提供了新信息，而是源于“共同写作”这一行为过程本身（即行为改变态度）。
干预失效发现： 挑战了传统的“接种理论”，发现简单的警告（事前或事后）无法抵消AI建议带来的态度转变，揭示了现有缓解措施的局限性。

关键实验结果：

态度显著转变： 在两个实验中，接触有偏见AI建议的参与者，其态度向AI立场的偏移量显著高于对照组（实验1偏移0.44刻度，实验2偏移0.41刻度）。
无意识性： 绝大多数（约80%以上）受到影响的参与者认为AI建议是“合理且平衡”的，且未意识到自己的思维被改变。
行为机制主导： AI自动完成建议造成的态度转变幅度（0.44）显著大于仅阅读相同论点列表的静态文本组（0.20），且与直接被要求“赞成写作”的组别（0.43）效果相当。
警告无效： 无论是写作前警告还是写作后简报，参与者的态度转变程度与未受警告组无显著差异，且他们依然缺乏对偏见的意识。