心理学报 | AI监管碰上你的暗黑人格,你还会诚实吗?
文献引用
王健树, 姜啸威,陈亚楠, 王明辉, 杜峰. (2026). 从显性威慑到隐性内化:AI监管和黑暗三联征人格对诚实行为的影响. 心理学报, 58(3), 381−398.
研究背景
研究变量
研究目的
-
分别探究3种不同类型的【AI监管】对【诚实行为】的影响 -
分别探究3种【黑暗三联征人格】在不同类型的【AI监管】与【诚实行为】之间的调节作用
研究假设
假设的推理逻辑
假设H1a
-
高马基雅维利主义者→精于成本−收益计算↗AI显性监管→提供明确的惩罚威胁信号→提高违规的预期社会成本↘采取策略性合规(表面遵守以规避惩罚)→诚实行为增加
-
高精神病态者→冲动性、低恐惧性↗AI显性监管→提供即时的、确定的惩罚威胁→产生较强的外部约束力↘决策更易受即时的、显著的后果驱动→诚实行为增加
假设H1b
-
高自恋者→关注自我形象↗AI显性监管形象→在匿名AI监管情境中,形象维护动机减弱↘诚实行为不增加
假设H2
-
AI隐性激励→满足胜任需要、潜在的自主需要→促进道德内化→诚实行为增加
-
高马基雅维利主义者→高度的工具理性和机会主义↗AI隐性激励→将奖励视为纯粹的外部工具→行为动机停留于外在调节水平→难以促进道德内化↘诚实行为增加、但易于恢复原状
-
高精神病态者→情感淡漠、对奖励的神经反应可能异常↗AI隐性激励→高层次需要无法满足→难以促进道德内化↘诚实行为增加、但易于恢复原状
-
高自恋者→追求优越感和特殊对待↗AI隐性激励→满足胜任需要→促进道德内化↘诚实行为增加并保持
假设H3a
-
AI社会激励→通过语言强化道德特质与自我的关联→提升道德认同的中心性→产生道德行为→诚实行为增加
-
高自恋者→自我膨胀但脆弱、强烈的自我增强需要→拥有积极的道德自我观↗AI社会激励→忽视或贬低泛泛的道德反馈→引发防御性反应↘诚实行为不增加
-
高精神病态者→情感冷漠、缺乏道德情感↗AI社会激励→无法激发内在道德动机↘诚实行为不增加
假设H3b
-
高马基雅维利主义者→愤世嫉俗,实用主义↗AI社会激励→进行表面的策略性调整→维持基本诚信的印象↘诚实行为增加
-
社会规范理论 -
自我决定理论 -
道德认同理论
研究框架
实验1
-
旨在考察【AI显性监管】分别与三种【黑暗三联征人格】对【诚实行为】的主效应与交互作用
实验2
-
旨在考察【AI监管条件】分别与三种【黑暗三联征人格】对【诚实行为】的主效应与交互作用
实验3
-
旨在同时考察【AI隐性激励】与【AI社会激励】分别与三种【黑暗三联征人格】对【诚实行为】的主效应与交互作用)
实验3a
-
旨在考察【AI隐性激励】分别与三种【黑暗三联征人格】对【诚实行为】的主效应与交互作用
实验3b
-
旨在(1)考察【AI社会激励】分别与三种【黑暗三联征人格】对【诚实行为】的主效应与交互作用)
-
旨在(2)考察对比【AI隐性激励】与【AI社会激励】的效应
研究工具
【黑暗三联征】
【诚实行为】
实验操纵
研究结论
(1)【AI显性监管】会增加整体的诚实行为。但是,相比于高自恋者,【AI显性监管】对高马基雅维利主义者与高精神病态者的诚实行为增加幅度更大。
(2)【AI隐性激励】会增加整体的诚实行为,但是,【AI隐性激励】对高马基雅维利主义者的诚实行为的维持效果不佳。
(3)【AI社会激励】难以增加整体的诚实行为,而且完全无法影响高自恋者的诚实行为。
(4)对于增加与维持个体的诚实行为,【AI隐性激励】比【AI社会激励】更有效。
研究意义
理论意义
(1)展示了在不同外部监管与激励情境下, 人格特质如何动态地调节行为适应策略, 从而极大地丰富了人格−情景交互理论。
(2)打破了传统理性人监管假设,将人格特质确立为AI伦理监管效果的关键调节变量。
(3)创新性地提出“人格校准的道德计算框架”,主张通过AI捕捉行为模式推断用户人格参数,动态调整监管策略,为智能、自适应的算法治理提供了理论蓝图。
(4)划定了传统道德认同理论在匿名数字化情境下的应用边界,揭示了社会激励失效的心理机制。
实践意义
(1)针对高马基雅维利主义者,必须以显性威慑与透明规则为核心,清晰量化违规成本。
(2)针对高精神病态者,应侧重强规则约束与即时、高频的经济奖惩,利用其对即时信号的敏感性。
(3)针对高自恋者,需避免无效的道德说教,转向显性规则与可公开的声誉激励(如独特徽章、特权),以满足其自我增强需求。
(4)整体设计:建议AI系统采用“显性规则为基础,经济激励为引导,个性化反馈为补充”的混合动态模式。
研究不足与展望
(1)样本局限性:样本量相对有限且集中于大学生群体,未来需在更广泛、更多样的人群中进行验证。
(2)统计方法:部分分析中对人格变量进行中位数分组,损失了信息。未来可更多采用保留连续变量特性的回归分析方法。
(3)生态效度:实验室掷硬币任务与现实世界的复杂道德决策存在差距,结论的推广需谨慎。
(4)测量单一性:人格测量依赖自陈量表,未来可结合行为观察、神经影像学等技术,获取更客观、多维的人格及决策指标。
(5)模型深化:提出的“人格校准的道德计算框架”尚处于概念阶段,未来需开发具体算法,探索其在真实AI系统中的部署与应用。
夜雨聆风