文献研读|当 AI 被认为比人更公平:求职评估中的 “算法滤镜”

如今AI 算法广泛介入简历筛选、岗位匹配、求职者适配度评估等招聘全流程，不少求职者、HR 对算法决策褒贬不一：有人认为算法客观中立不存在主观偏见，判定结果更公正；也有人质疑算法只会量化指标，无法读懂求职者软性特质。当 AI 与人类给出相同录用或拒聘结论时，人们的接受度为何天差地别？大众对算法公平、专业、可信的感知由哪些心理机制主导？

本期我们团队成员- 项文娟，为大家研读分享2024 年发表于International Journal of Human - Computer Interaction的实证论文When AI is Perceived to Be Fairer than a Human: Understanding Perceptions of Algorithmic Decisions in a Job Application Context。该研究聚焦求职初期岗位适配评估场景，融合 2×2 被试间线上实验与有调节的中介分析，厘清大众对算法决策、人类决策感知差异的形成逻辑，为人资领域 AI 招聘系统设计、人机招聘分工落地提供实践指导。

文献研读分享

题目：When AI is Perceived to Be Fairer than a Human: Understanding Perceptions of Algorithmic Decisions in a Job Application Context

作者：Hyesun Chou, John S. Seberger & Prabu David

期刊：International Journal of Human - Computer Interaction

年代：2024

分享人：项文娟

文献综述

1.算法决策与人资招聘相关研究

（1）应用现状

算法决策现已覆盖简历初筛、面试分析、绩效考评、晋升薪资核定全招聘链条，谷歌等企业宣称算法招聘表现优于人类，但算法歧视、脱离场景等争议持续存在。

（2）研究缺口

现有研究多站企业视角分析自动化招聘流程，极少从求职者视角，探究求职初期岗位适配评估阶段大众对算法的主观感受；且过往关于AI 招聘感知的实证结论相互矛盾，缺少统一实证结论厘清分歧。

2.算法偏好与算法厌恶相关研究

（1）核心概念

算法厌恶指人们主动贬低算法判断、更信赖人类决策，根源是大众潜意识不信任机器，认为算法简化信息、缺少人文场景感知；算法偏好指民众认可机器比人类客观可靠，愿意采信算法给出的各类建议。

（2）研究分歧

不同任务下两种感知并存，客观量化任务易催生算法偏好，创意、道德类任务易出现算法厌恶；人力资源领域内求职者在招聘不同阶段会交替出现两种感知，现有研究未探明两种感知的边界条件。

（3）研究缺口

现有综述将算法研究变量划分为算法、个体、任务、宏观四大维度，但学界过往重点关注算法与个体因素，缺少任务属性、决策结果变量的实证探索。

3.结果有利性偏差相关研究

（1）核心概念

结果有利性指代决策结论是否契合当事人预期，个体存在自利偏差，会美化对自己有利的决策者，苛责给出不利结果的决策者。

（2）研究缺口

现有算法领域研究极少将决策结果作为核心变量，未对比有利、不利结论下大众对AI、人类决策者的差异化评价。

4.求职者量化、质性资质评估感知相关研究

（1）核心逻辑

过往“简化论” 观点认为算法只会量化硬技能，忽略沟通、创造力等软性质性特质，因此公平感知更低；但伴随 NLP 等 AI 技术普及，大众对算法处理质性信息的认知正在更新，该变化缺少实证验证。

（2）研究缺口

少有研究将量化、质性考量感知作为中介变量，解释大众偏爱/ 抵触算法的内在心理路径。

5.四大感知维度（公平、专业、信任、实用）相关研究

（1）理论基础

技术接受模型（TAM）证实感知实用性是技术采纳核心变量；公平、专业、信任是学界公认评估算法的关键指标，公平分为程序公平、分配公平两类。

（2）研究缺口

现有研究未在同一求职实验场景下，同步对比AI、人类在四大维度的评分差异，也未检验决策主体、决策结果二者的交互影响。

理论基础

1.技术接受模型（Technology Acceptance Model, TAM）

（1）核心观点

感知实用性是用户接纳新技术的核心预测因素，可延伸解释求职者对AI 招聘平台的使用意愿。

（2）应用逻辑

本研究将感知实用性、公平、专业、信任作为四大核心观测指标，完整衡量求职者对岗位评估系统的综合评价。

2.算法偏好/ 算法厌恶二元理论（algorithm aversion & algorithm appreciation）

（1）核心观点

大众对算法存在两种对立稳定心理倾向，倾向强弱由任务类型、决策结果、个人技术熟悉度共同调节。

（2）应用逻辑

本实验对比有利、不利两种结果，验证求职适配评估场景下何种倾向占据主导，找到算法偏好的触发条件。

3.结果有利性偏差理论（outcome favorability bias）

（1）核心观点

个体存在自利归因心理，面对符合自身期待的决策时，会正向评价决策者；面对负面结果则否定决策者能力与动机。

（2）应用逻辑

该理论支撑本文核心假设1，预测有利结果会全面提升决策者四项感知评分。

4.简化论（reductionism）

（1）核心观点

算法会将求职者丰富的个人特质压缩为可量化数字，丢失软性、场景化质性信息，进而降低大众感知公平性。

（2）应用逻辑

本研究检验当下大众是否仍持有“算法只懂量化、不懂软性特质” 的刻板印象，以此修正简化论在 AI 普及背景下的适用边界。

研究问题与研究假设

1.研究问题

（1）RQ1：求职适配评估任务中，算法决策、人类决策在公平性、专业性、可信度、实用性四维感知上存在何种差异？

（2）RQ2：决策主体（AI / 人类）与结果有利（有利 / 不利）是否对四大感知存在交互作用？

（3）RQ3：决策主体、结果有利是否改变大众感知到的决策者对求职者量化、质性资质的考量程度？

（4）RQ4：量化、质性资质考量感知，是否在决策主体与四大感知之间发挥中介作用？

2.研究假设

H1：相较于不利决策结果，有利结果会让大众对决策者的公平、专业、信任、实用性评价更高。

实验研究

1.研究目的

采用2×2 被试间实验，验证决策主体、结果有利的主效应与交互效应；检验量化、质性考量感知的中介作用，厘清算法偏好产生的内在心理机制，填补 AI 招聘感知领域的研究分歧。

2.研究设计

采用2（决策主体：AI 算法 / 人类协调员）×2（决策结果：有利 / 不利）被试间线上实验设计；后续采用有调节的中介模型完成机制检验。

3.实验流程

（1）受试者阅读知情同意书，了解虚构求职匹配平台 JobConnect 与社交媒体实习生岗位、对应求职者简历。

（2）随机分配至四组实验，分别告知评估主体为 AI 或人类，展示高分有利评估（90/100）或低分不利评估（40/100）。

（3）填写量表，完成公平、专业、信任、实用性感知打分，同时评估决策者对量化、质性资质的考量程度。

（4）完成操纵检验题目，确认受试者清晰区分决策主体与决策结果。

4.研究结果

（1）主效应结果：整体存在稳定主体主效应，相比人类，受试者认为 AI 评估更公平、专业、可信、实用；存在稳定结果主效应，有利结果下对决策者全部评价更高，假设 1 成立。

（2）交互效应结果：公平、专业、信任三维度存在显著交互，实用性交互边际显著；算法偏好仅在不利结果下显著，有利结果时 AI 与人类评价无明显差距。面对拒聘等负面判定，大众对人类的抵触远高于 AI。

（3）量化、质性感知结果：无论结果好坏，大众均认为 AI 兼顾更多求职者质性特质；有利场景下 AI 与人类量化考量感知无差异，不利场景下 AI 量化考量感知显著更高。

（4）中介机制结果：有利场景下，仅质性考量感知发挥中介；不利场景下，量化、质性考量共同形成双中介路径，解释大众更认可 AI 的心理逻辑。

讨论

1.求职适配评估场景下大众呈现明显算法偏好，而非算法厌恶，根源是大众认为AI 规则统一、无主观偏见，且当下认知已打破 “算法只会量化” 的旧刻板印象。

2.结果有利性偏差具备差异化影响，负面结果会大幅拉低人类决策者评分，但对AI 评价削弱幅度极小；正面结论下人机评价无明显差别。

3.大众认为AI 能够充分兼顾沟通、创造力等软性质性特质，与传统简化论预测相悖，AI 普及更新了大众对机器分析能力的认知。

4.算法偏好由量化、质性资质考量感知共同驱动，两种感知构成稳定中介心理路径。

理论与实践启示

1.理论启示

（1）丰富算法偏好 / 厌恶理论边界条件，证明任务属性、决策结果会调节大众对 AI 的心理倾向，推翻简化论在当前 AI 环境下的单一适用结论。

（2）拓展人机交互理论，指出人人交互的动机、归因逻辑不适用于人机场景，需构建专属人机感知理论体系。

（3）完善技术接受模型在人力资源 AI 场景的应用，证实公平、专业、信任与实用性高度关联，共同决定大众对招聘系统的接纳度。

（4）提出 “过度信任” 风险，大众高估 AI 综合评估能力，容易对算法产生无底线依赖，需要全民数字素养加以平衡。

2.实践启示

（1）招聘流程分工优化：负面反馈、拒聘通知类评估可交由 AI 输出，降低求职者抵触情绪；但需警惕大众不加批判顺从算法，形成数字顺从。

（2）AI 招聘系统优化设计：系统需可视化展示对求职者软硬特质的综合评估过程，强化大众感知到的量化、质性兼顾程度，提升系统公平感知。

（3）企业人资规范：不能完全依赖算法完成全流程人员判定，需保留人类介入通道，平衡算法客观优势与人的场景人文判断力；同步面向求职者开展算法科普，引导理性看待 AI 评估结果。

研究局限与未来研究方向

1.研究局限

（1）线上实验外部效度有限，样本人口结构存在偏差，实验场景风险偏低，高利害招聘场景结论可能改变。

（2）仅设置纯 AI、纯人类两组，缺少人机协同决策对照组；受试者仅旁观评估，而非自身接受判定，感知存在差异。

（3）仅选取量化、质性感知作为中介，未纳入情绪、个人 AI 熟悉度等其他潜在心理变量。

2.未来研究方向

（1）增设人机协同实验组，对比纯 AI、纯人类、人机共管三类场景下的感知差异；拓展校招、高管选拔等高风险招聘场景重复验证结论。

（2）纳入个体数字素养、组织伦理氛围等变量，完善算法偏好的边界条件模型。

（3）结合生成式 AI 发展，探究大模型处理复杂软性特质后，大众对算法的感知变化，研究算法偏好向算法过度依赖的演化路径。

✨本期分享人项文娟，浙江工商大学应用心理学专业一年级研究生，来自浙江湖州。当前研究兴趣聚焦于人工智能在人力资源管理中的应用，尤其关注求职者在 AI 面试情境下的互动行为及其引发的道德反应。

✨智研前沿 Human-AI Inquiry 是由浙商大 Insight & Interaction Lab 研究小组运营管理的公众号，聚焦商科语境下人工智能与人类社会的交汇研究，分享学术文献精读与研究洞察。关注我们，洞见智能时代的商业与人文前沿。