薪酬链的雷还没拆完,绩效这边又炸了。
初默没想到,一个绩效打分会把团队搞散。
初默的困境:产出更好的那个人,绩效分更低
起因是Q2的绩效评估。
市场部两个分析师——就是上次汇报会上的王磊和陈悦。
初默按公司的绩效表打分,主要看三个维度:任务完成率、工作饱和度、工作量。
王磊: - 任务完成率:100%(3天交付,从不拖延) - 工作饱和度:高(每天都在写报告、跑数据) - 工作量:中等偏上(本季度完成8份分析报告) - 综合评分:A
陈悦: - 任务完成率:100%(1天半交付,从不拖延) - 工作饱和度:中等(用AI完成基础工作后,有部分时间在做“额外探索”) - 工作量:中等(本季度完成8份分析报告+2份AI工具优化方案) - 综合评分:B+
初默的打分逻辑很清楚:王磊天天忙满,饱和度高,A没问题。陈悦虽然产出快,但“看起来没那么忙”,而且她用AI省出来的时间,有一部分在做“非本职工作”(AI工具优化方案不算分析师的KPI),所以B+。
结果出来,陈悦直接找初默谈话了。
“袁总,我有个问题想不通。我产出比王磊快、质量比他高、还额外做了AI工具优化帮团队提效,为什么我绩效比他低?”
初默说:“你的工作饱和度确实不如王磊,而且AI工具优化不在你的岗位KPI里。”
陈悦沉默了几秒,说了一句让初默愣住的话:
“所以,我因为用AI提高了效率,反而被扣分了?”
初默张了张嘴,发现自己没法反驳。
更深层的问题还在后面。
陈悦走后,初默的助理小赵私下跟他说了一句话:“陈悦已经在看外部机会了。她说既然干得越好分越低,不如去一个能看到她价值的地方。”
初默这才意识到,问题不只是打分的事——是他整个绩效逻辑出了问题。
讲讲这件事儿的逻辑:你考核的还是“做了多少”,但价值已经不在“做”上了
初默的打分方式,是绝大多数企业绩效管理的缩影。
看三个指标:完成率、饱和度、工作量。三个指标有一个共同特点——全部指向“做了多少”。
你完成了多少任务?你每天忙不忙?你干了多少活?
这个考核逻辑有一个隐含假设:做得多=价值大。
在过去,这个假设基本成立。因为人能做的就那么多,做得越多、越快,产出越大,价值越高。所以考核“做了多少”基本能反映价值。
AI来了,这个假设碎了。
当AI可以替代执行——数据整理、报告初稿、信息检索、模型搭建——“做”这件事本身不值钱了。AI做得比人快、比人准、比人多。
值钱的是什么?是“做什么”和“判断对不对”。
陈悦的价值,不在于她写了多少份报告,而在于:- 她判断了AI建模的结果对不对——这是判断力 - 她优化了AI工具的使用方式帮团队提效——这是驾驭力 - 她用省出来的时间探索了新的工作方法——这是创新力
但这三样东西,在初默的绩效表上一个都没有。
绩效管理的对象变了,但考核逻辑没变。你还在用“做了多少”衡量一个“人+AI”的产出体系——就像用尺子量温度,工具不对,量什么都白搭。
场景与能力被重新定义
绩效管理这件事,底层逻辑正在从“衡量执行”转向“激励判断”。
旧逻辑:目标设定→过程跟踪→年底打分。考核“做了多少”。
新逻辑:目标设定→人机协同→产出评估。考核“判断对了多少、驾驭效率多高、产出质量怎样”。
这不是调几个KPI的事,是考核的底层逻辑要换。
旧体系里,考核对象是“人做了什么”。你写了多少行代码、见了多少客户、做了多少份报告——清清楚楚。
新体系里,考核对象变成了“人+AI产出了什么,其中人的判断力贡献了多少”。同样一份报告,A手写3天质量7分,B用AI+1天半质量8分——你用同一套标准考核两个人,公平吗?
更复杂的场景:一个人用AI产出了高质量的工作成果,但他“只干了半天”。另外一个人不用AI,花了三天干出中等质量的成果。你按工时考核,后者得分高。你按产出考核,前者得分高。
按工时?按产出?按过程?按判断力贡献?这四个维度,旧绩效体系一个都回答不了。
新场景下HR该干什么、需要什么能力
绩效被重新定义之后,HR需要做三件新事:
第一件:设计人机协同的绩效指标体系。
不是在旧KPI上修修补补,是重新设计指标维度。我建议人机协同绩效从三个维度衡量:
维度一:产出质量。最终交付物的质量如何?客户/业务方是否满意?这是结果导向,不管你用什么方式完成,质量是硬标准。
维度二:驾驭效率。你用AI的效率如何?同样一个任务,你用AI的效率提升倍数是多少?这个维度衡量的是“你会不会用AI”,不是“你做了多少”。
维度三:判断力贡献。在AI产出的基础上,你做了什么关键判断?这些判断对最终产出的质量提升有多大?这个维度衡量的是“AI做不了的那部分”,也就是人真正的价值。
三个维度的权重,不同岗位不同。偏执行的岗位,驾驭效率权重高;偏决策的岗位,判断力贡献权重高。
第二件:重新设计绩效校准会。
旧校准会的问题:用同一把尺子量所有人。
新校准会要解决的问题:AI辅助产出的绩效怎么横向比较?
•两个部门,一个全面用AI,一个还没上AI——产出效率天然不同,怎么比?
•同一个部门,有人用AI有人不用——产出质量和速度都不同,怎么排?
•一个人用AI做了10件事,另一个人手做了3件事——谁贡献大?
这些问题的答案,不是“一刀切拉平”,而是在校准会中引入“AI赋能系数”——考虑AI工具的可用程度、员工使用AI的熟练程度、岗位AI替代率的差异,对绩效结果做校准调整。
不是降谁的分,是让不同起点的人能在同一套体系里被公平地看见。
第三件:从“流程管理”转向“绩效赋能”。
旧绩效管理的逻辑是管控——设定目标、跟踪过程、年底算账、奖惩兑现。
新绩效管理的逻辑是赋能——帮员工找到在AI旁边的最佳位置,帮他判断哪些事该交给AI、哪些事必须自己扛,帮他在新规则下最大化自己的价值。
绩效管理的本质从来不是“衡量人做了多少”,而是“激励人创造更多价值”。AI只是把这句话逼到了死角——当工具可以替代执行,人的价值只剩判断力。
这三件事,需要什么新能力?
•人机协同指标设计能力——能把“产出质量、驾驭效率、判断力贡献”三个维度落地为可量化、可评估的指标
•AI赋能校准能力——能在绩效校准会中公平地处理AI使用差异,不是拉平,是校准
•绩效赋能设计能力——能把绩效管理从“算账工具”变成“价值发现工具”,帮员工在AI旁边找到自己的定位
这三项能力,跟传统绩效管理的“目标分解+过程跟踪+打分排序”完全不是一个物种。
其他HR的坑你不要再踩了
坑一:按工时考核。“你只干了半天”——但人家半天干出了你三天干不出的活。按工时考核,就是在惩罚效率。
坑二:按完成率考核。完成率100%但质量一般,和完成率80%但质量极高——你奖谁?AI时代,完成率是最没信息量的指标。
坑三:用同一标准考核会用AI和不会用AI的员工。一个用AI一天半出8分报告,一个手写三天出7分报告——你用同一把尺子量,必然不公平。
坑四:忽视“判断力贡献”。陈悦帮团队优化AI工具、探索新工作方法,这些不在KPI里,但恰恰是AI时代最有价值的行为。你的考核表上看不见,员工就不愿意做。
坑五:绩效管理停留在“算账”。年底打分、排等、分奖金——这是算账。AI时代的绩效管理应该是“帮员工找到自己最值钱的位置”。算账是向后看,赋能是向前看。
坑六:绩效校准会没有AI维度。两个部门AI渗透率不同,产出效率天然不同——但校准会上没人提这个变量。结果就是AI用得好的部门“被平均”,AI还没上的部门“被保护”。两边都不服。
最后的启示
绩效管理的本质,从来不是衡量人做了多少,而是激励人创造更多价值。
AI只是把这句话变得更尖锐了——当工具可以替代执行,人的价值只剩判断力。
考核要从“做了多少”转向“判断对了多少”。
这不是换个打分表的事,是整个考核逻辑的底座要换。从衡量执行到衡量判断,从管控过程到赋能价值,从向后算账到向前布局。
你考核什么,员工就往什么方向努力。你考工时,他就磨时间。你考完成率,他就挑容易的做。你考判断力贡献,他才会真正去想“AI做不了的那部分,我能做什么”。
方向对了,绩效管理才不会成为AI时代的绊脚石。
不在存量里争利益,要在增量中分收益。——袁玉山|绩效分钱砖家|从业25年 · 12年咨询实战 · 近百家实操辅导|专注于组织效能提升!
信息来源:
1.美世2026《全球人才趋势报告》(Mercer Global Talent Trends 2026)
夜雨聆风