如今AI 算法广泛介入简历筛选、岗位匹配、求职者适配度评估等招聘全流程,不少求职者、HR 对算法决策褒贬不一:有人认为算法客观中立不存在主观偏见,判定结果更公正;也有人质疑算法只会量化指标,无法读懂求职者软性特质。当 AI 与人类给出相同录用或拒聘结论时,人们的接受度为何天差地别?大众对算法公平、专业、可信的感知由哪些心理机制主导?

本期我们团队成员- 项文娟,为大家研读分享2024 年发表于International Journal of Human - Computer Interaction的实证论文When AI is Perceived to Be Fairer than a Human: Understanding Perceptions of Algorithmic Decisions in a Job Application Context。该研究聚焦求职初期岗位适配评估场景,融合 2×2 被试间线上实验与有调节的中介分析,厘清大众对算法决策、人类决策感知差异的形成逻辑,为人资领域 AI 招聘系统设计、人机招聘分工落地提供实践指导。
文献研读分享
题目:When AI is Perceived to Be Fairer than a Human: Understanding Perceptions of Algorithmic Decisions in a Job Application Context
作者:Hyesun Chou, John S. Seberger & Prabu David
期刊:International Journal of Human - Computer Interaction
年代:2024
1.算法决策与人资招聘相关研究
(1)应用现状
算法决策现已覆盖简历初筛、面试分析、绩效考评、晋升薪资核定全招聘链条,谷歌等企业宣称算法招聘表现优于人类,但算法歧视、脱离场景等争议持续存在。
(2)研究缺口
现有研究多站企业视角分析自动化招聘流程,极少从求职者视角,探究求职初期岗位适配评估阶段大众对算法的主观感受;且过往关于AI 招聘感知的实证结论相互矛盾,缺少统一实证结论厘清分歧。
2.算法偏好与算法厌恶相关研究
(1)核心概念
算法厌恶指人们主动贬低算法判断、更信赖人类决策,根源是大众潜意识不信任机器,认为算法简化信息、缺少人文场景感知;算法偏好指民众认可机器比人类客观可靠,愿意采信算法给出的各类建议。
(2)研究分歧
不同任务下两种感知并存,客观量化任务易催生算法偏好,创意、道德类任务易出现算法厌恶;人力资源领域内求职者在招聘不同阶段会交替出现两种感知,现有研究未探明两种感知的边界条件。
(3)研究缺口
现有综述将算法研究变量划分为算法、个体、任务、宏观四大维度,但学界过往重点关注算法与个体因素,缺少任务属性、决策结果变量的实证探索。
3.结果有利性偏差相关研究
(1)核心概念
结果有利性指代决策结论是否契合当事人预期,个体存在自利偏差,会美化对自己有利的决策者,苛责给出不利结果的决策者。
(2)研究缺口
现有算法领域研究极少将决策结果作为核心变量,未对比有利、不利结论下大众对AI、人类决策者的差异化评价。
4.求职者量化、质性资质评估感知相关研究
(1)核心逻辑
过往“简化论” 观点认为算法只会量化硬技能,忽略沟通、创造力等软性质性特质,因此公平感知更低;但伴随 NLP 等 AI 技术普及,大众对算法处理质性信息的认知正在更新,该变化缺少实证验证。
(2)研究缺口
少有研究将量化、质性考量感知作为中介变量,解释大众偏爱/ 抵触算法的内在心理路径。
5.四大感知维度(公平、专业、信任、实用)相关研究
(1)理论基础
技术接受模型(TAM)证实感知实用性是技术采纳核心变量;公平、专业、信任是学界公认评估算法的关键指标,公平分为程序公平、分配公平两类。
(2)研究缺口
现有研究未在同一求职实验场景下,同步对比AI、人类在四大维度的评分差异,也未检验决策主体、决策结果二者的交互影响。
理论基础
1.技术接受模型(Technology Acceptance Model, TAM)
(1)核心观点
感知实用性是用户接纳新技术的核心预测因素,可延伸解释求职者对AI 招聘平台的使用意愿。
(2)应用逻辑
本研究将感知实用性、公平、专业、信任作为四大核心观测指标,完整衡量求职者对岗位评估系统的综合评价。
2.算法偏好/ 算法厌恶二元理论(algorithm aversion & algorithm appreciation)
(1)核心观点
大众对算法存在两种对立稳定心理倾向,倾向强弱由任务类型、决策结果、个人技术熟悉度共同调节。
(2)应用逻辑
本实验对比有利、不利两种结果,验证求职适配评估场景下何种倾向占据主导,找到算法偏好的触发条件。
3.结果有利性偏差理论(outcome favorability bias)
(1)核心观点
个体存在自利归因心理,面对符合自身期待的决策时,会正向评价决策者;面对负面结果则否定决策者能力与动机。
(2)应用逻辑
该理论支撑本文核心假设1,预测有利结果会全面提升决策者四项感知评分。
4.简化论(reductionism)
(1)核心观点
算法会将求职者丰富的个人特质压缩为可量化数字,丢失软性、场景化质性信息,进而降低大众感知公平性。
(2)应用逻辑
本研究检验当下大众是否仍持有“算法只懂量化、不懂软性特质” 的刻板印象,以此修正简化论在 AI 普及背景下的适用边界。
研究问题与研究假设
1.研究问题
(1)RQ1:求职适配评估任务中,算法决策、人类决策在公平性、专业性、可信度、实用性四维感知上存在何种差异?
(2)RQ2:决策主体(AI / 人类)与结果有利(有利 / 不利)是否对四大感知存在交互作用?
(3)RQ3:决策主体、结果有利是否改变大众感知到的决策者对求职者量化、质性资质的考量程度?
(4)RQ4:量化、质性资质考量感知,是否在决策主体与四大感知之间发挥中介作用?
2.研究假设
H1:相较于不利决策结果,有利结果会让大众对决策者的公平、专业、信任、实用性评价更高。
实验研究
1.研究目的
采用2×2 被试间实验,验证决策主体、结果有利的主效应与交互效应;检验量化、质性考量感知的中介作用,厘清算法偏好产生的内在心理机制,填补 AI 招聘感知领域的研究分歧。
2.研究设计
采用2(决策主体:AI 算法 / 人类协调员)×2(决策结果:有利 / 不利)被试间线上实验设计;后续采用有调节的中介模型完成机制检验。
3.实验流程
(1)受试者阅读知情同意书,了解虚构求职匹配平台 JobConnect 与社交媒体实习生岗位、对应求职者简历。
(2)随机分配至四组实验,分别告知评估主体为 AI 或人类,展示高分有利评估(90/100)或低分不利评估(40/100)。
(3)填写量表,完成公平、专业、信任、实用性感知打分,同时评估决策者对量化、质性资质的考量程度。
(4)完成操纵检验题目,确认受试者清晰区分决策主体与决策结果。
4.研究结果
(1)主效应结果:整体存在稳定主体主效应,相比人类,受试者认为 AI 评估更公平、专业、可信、实用;存在稳定结果主效应,有利结果下对决策者全部评价更高,假设 1 成立。
(2)交互效应结果:公平、专业、信任三维度存在显著交互,实用性交互边际显著;算法偏好仅在不利结果下显著,有利结果时 AI 与人类评价无明显差距。面对拒聘等负面判定,大众对人类的抵触远高于 AI。
(3)量化、质性感知结果:无论结果好坏,大众均认为 AI 兼顾更多求职者质性特质;有利场景下 AI 与人类量化考量感知无差异,不利场景下 AI 量化考量感知显著更高。
(4)中介机制结果:有利场景下,仅质性考量感知发挥中介;不利场景下,量化、质性考量共同形成双中介路径,解释大众更认可 AI 的心理逻辑。
讨论
1.求职适配评估场景下大众呈现明显算法偏好,而非算法厌恶,根源是大众认为AI 规则统一、无主观偏见,且当下认知已打破 “算法只会量化” 的旧刻板印象。
2.结果有利性偏差具备差异化影响,负面结果会大幅拉低人类决策者评分,但对AI 评价削弱幅度极小;正面结论下人机评价无明显差别。
3.大众认为AI 能够充分兼顾沟通、创造力等软性质性特质,与传统简化论预测相悖,AI 普及更新了大众对机器分析能力的认知。
4.算法偏好由量化、质性资质考量感知共同驱动,两种感知构成稳定中介心理路径。
理论与实践启示
1.理论启示
(1)丰富算法偏好 / 厌恶理论边界条件,证明任务属性、决策结果会调节大众对 AI 的心理倾向,推翻简化论在当前 AI 环境下的单一适用结论。
(2)拓展人机交互理论,指出人人交互的动机、归因逻辑不适用于人机场景,需构建专属人机感知理论体系。
(3)完善技术接受模型在人力资源 AI 场景的应用,证实公平、专业、信任与实用性高度关联,共同决定大众对招聘系统的接纳度。
(4)提出 “过度信任” 风险,大众高估 AI 综合评估能力,容易对算法产生无底线依赖,需要全民数字素养加以平衡。
2.实践启示
(1)招聘流程分工优化:负面反馈、拒聘通知类评估可交由 AI 输出,降低求职者抵触情绪;但需警惕大众不加批判顺从算法,形成数字顺从。
(2)AI 招聘系统优化设计:系统需可视化展示对求职者软硬特质的综合评估过程,强化大众感知到的量化、质性兼顾程度,提升系统公平感知。
(3)企业人资规范:不能完全依赖算法完成全流程人员判定,需保留人类介入通道,平衡算法客观优势与人的场景人文判断力;同步面向求职者开展算法科普,引导理性看待 AI 评估结果。
研究局限与未来研究方向
1.研究局限
(1)线上实验外部效度有限,样本人口结构存在偏差,实验场景风险偏低,高利害招聘场景结论可能改变。
(2)仅设置纯 AI、纯人类两组,缺少人机协同决策对照组;受试者仅旁观评估,而非自身接受判定,感知存在差异。
(3)仅选取量化、质性感知作为中介,未纳入情绪、个人 AI 熟悉度等其他潜在心理变量。
2.未来研究方向
(1)增设人机协同实验组,对比纯 AI、纯人类、人机共管三类场景下的感知差异;拓展校招、高管选拔等高风险招聘场景重复验证结论。
(2)纳入个体数字素养、组织伦理氛围等变量,完善算法偏好的边界条件模型。
(3)结合生成式 AI 发展,探究大模型处理复杂软性特质后,大众对算法的感知变化,研究算法偏好向算法过度依赖的演化路径。
✨本期分享人项文娟,浙江工商大学应用心理学专业一年级研究生,来自浙江湖州。当前研究兴趣聚焦于人工智能在人力资源管理中的应用,尤其关注求职者在 AI 面试情境下的互动行为及其引发的道德反应。
✨智研前沿 Human-AI Inquiry 是由浙商大 Insight & Interaction Lab 研究小组运营管理的公众号,聚焦商科语境下人工智能与人类社会的交汇研究,分享学术文献精读与研究洞察。关注我们,洞见智能时代的商业与人文前沿。
夜雨聆风