2026年4月30日,黄仁勋在一个播客上讲了一段话。他没点名,但所有人都知道他在说谁。
"有些CEO一当上CEO就产生了上帝情结——还没等你反应过来,他就觉得自己什么都懂了。"
他说的是Anthropic的CEO Dario Amodei。Amodei此前公开讲过两件事:AI五年内消灭50%初级白领工作;卖芯片给中国等于卖核武器给朝鲜。黄仁勋直接回了一个词:"lunacy"(疯了)。
硅谷最有权势的两个人,在AI的未来上站在两个极端。Amodei这边的画风是末日论:AI是浓缩铀,会重创就业市场。黄仁勋那边的画风是繁荣论:AI是蒸汽机,已经创造了50万个岗位。
但你注意到没有——他们争的东西,有一个共同的盲区。
两个人都在争"消失多少个岗位、新增多少个岗位"的数字,从WEF预测的7800万到McKinsey估算的8亿,数据打架得很凶,但这不是重点。重点在于没人讨论那些新岗位到底长什么样?也没人问旧岗位里被AI替换掉的那一部分,本质到底是什么?这两件事,恰好是普通人在关心的问题。他们争的是数字,但答案不在那些数字里,答案藏在AI替你省掉的每一秒枯燥里,在那些你以为是"效率提升",其实是消失的锻炼机会里。
新岗位长什么样?
这些岗位不是画饼,是现在就能搜到、能投简历的。
不过在讲新岗位之前,先看看谁在消失,这能让你对"AI到底替换了哪类工作"有个手感。正在消失的名单很长:数据录入员替代率95%,电话销售80%以上,客服代表80%,基础翻译85%,簿记和初级会计70%以上,法律文书初筛65%以上。美国劳工统计局预计收银员将减少35万个岗位,银行柜员将减少5万以上。这些岗位有一个共通的特征:输入→处理→输出的标准化闭环,AI从起点到终点全链路都能覆盖。换句话说,只要你的工作是一手接东西、一手交东西、中间不产生任何"判断"——AI就能替你干。
那新冒出来的是什么呢?以下三个方向是目前最值得关注的。
第一类:AI Evaluator,给AI打分的人。

这是目前最被低估、但需求增速最快的一个岗位。
一家公司花几百万部署了AI,然后问题来了:你怎么知道它变好了还是变差了?传统的测试用例不管用,因为同样的输入AI两次可能给出完全不同的答案。于是就有了一个棘手的问题:谁来定"什么叫好"?这个岗位每天干的活很具体,设计测试场景、写评估指标、建一套自动化评测流水线,核心问题只有一个——你怎么测量一个"模糊的好"?
要什么能力呢?高端岗位需要编程底子,但更关键的是对"质量"有一种强迫症般的敏感,能把"感觉不太对"翻译成"在X类问题上准确率低于85%"。做过QA、做过测试、或者在某个领域扎了十年的专家转型最顺。金融、法律、医疗这些强合规行业需求最猛,因为AI在这些领域一旦出错,代价不是"用户体验不好",是真金白银的损失甚至人命。
薪资方面,美国市场160K到400K+美元,换算过来约人民币115万到290万。国内有参照:2026年春招AI相关岗位平均月薪60,738元,高端AI人才年薪可达140万元。但专门做AI评测的岗位目前极度稀缺,招聘才刚刚起步,这意味着谁先入局谁就吃第一波红利。
有一点值得单说:这个岗位的"可培训性"非常低。你没法给一个刚毕业的大学生发一本《AI评测手册》让他三个月上岗,因为"什么叫好"本身就是一个需要经验积累的判断。这就像一个老编辑改稿子,你说不清他改了哪里,但改完以后就是比原来好。AI Evaluator的护城河不在技术,在判断力的厚度。
第二类:Forward-Deployed Engineer,前沿部署工程师,可以理解成AI的现场翻译。

这个岗位2025年招聘量暴涨了800%,听起来吓人,但原因很朴素:大部分企业买了AI但不知道怎么用。不是AI不够好,是企业的业务流程和AI的能力之间隔着一道墙,墙上没有人开门。
FDE就是那个去现场开门的人。他飞到客户公司,坐在人家办公室里,把AI接进真实的业务流程:写代码对接系统、改工作流让AI嵌进去、教客户的团队学会跟AI协作。整个工作的本质不是技术活,是翻译活:把业务需求翻译成AI能执行的动作,再把AI的输出翻译回人类的业务语言。这就像把一个外国工程师丢进一家中国工厂,他不是来给机器换零件的,他是来让车间主任和外籍师傅互相听懂的。
切入路径很清晰:全栈开发或技术咨询出身的人最顺手,因为这两种人本来就习惯在陌生环境里快速搭建东西。国内已经有类似角色在招人——如果搜"前沿部署""FDE"没结果,试试搜"AI解决方案工程师""AI交付专家"或"客户成功工程师(技术方向)"。不同公司叫法不一样,但本质是同一件事:去现场把AI接进真实世界。薪资美国市场238K到700K美元,换算约人民币173万到508万。
第三类:Agentic Workflow Architect,AI的管家。

这个岗位的背景很具体:当一家公司部署了多个AI agent,一个分析数据、一个写报告、一个跟客户交互,麻烦就来了。这几个agent谁先干活?数据怎么在它们之间传递?其中一个把数据传错了,谁来发现?这就好比你有三个实习生,一个查资料、一个写PPT、一个发邮件,但你一转身他们就开始各干各的,最后邮件发出去的数据是错的,PPT里引用的段落是前一天的版本。
Agentic Workflow Architect干的就是设计多agent协作规则,监控信息传递,防止agent出现"行为漂移"。行为漂移是个术语,大白话就是agent跑着跑着就跑偏了,做的事跟最初设定的目标越来越远。
这个岗位要的不是深度编程能力,是系统工程思维,要对整个业务流程有整体感。做过运营管理、供应链、项目管理的人天然适合,因为他们最清楚一个环节堵了怎么堵全身,那种痛是刻在骨头里的。入门可以从LangChain、CrewAI这类agent框架开始,国内搜"AI流程编排""Agent开发"就能找到学习路径。薪资美国市场140K到210K美元,约人民币102万到152万。
注意到这三个岗位的共性没有?AI Evaluator判断AI做得对不对,FDE把AI接进真实世界,Agentic Workflow Architect在多个AI之间指路——这三个恰好是AI最不擅长的三件事,没有一个岗位要求你比AI聪明,它们要求的,是AI没有的东西。
旧岗位里被替换掉的,本质是什么?
新岗位在长出来,这是事实。
但老岗位里丢掉的那些东西呢?你可能会说,既然有新机会,转型不就完了吗。
更重要的是,那些新岗位需要的核心能力——判断AI对不对、听懂客户没说出口的话、设计复杂的协作——恰好是在旧岗位的枯燥练习里长出来的。如果练习场没了,新岗位由谁来填?
那些"老岗位"不只是一个发工资的地方,它们是新手长出判断力的唯一土壤。AI替换掉的,表面上是任务,实际上是这片土壤本身。
第一个被断了的新手村:影像科住院医的"看一万张正常片"。
一个普通的放射科住院医,前三年在干什么?看胸片。
肺炎、气胸、肺结节,这些当然也看。但占据绝大多数时间的,是看正常的片子,没有病变的那些。一千张正常胸片里夹着几例异常,你要把异常从正常里挑出来。这可能是全世界最枯燥的训练之一,但在这一千张、一万张地看过去之后,他的眼睛会发生一种化学级别的东西:一张胸片扫过去,0.3秒,大脑里就亮起一个警报,那个密度不对,那块轮廓不正常。
不是大脑在分析,是眼睛先亮,脑子后跟上。
这不是知识点,靠背书学不会。这叫"正常感"被磨到了极敏感,稍微偏离正常的,一秒就察觉。就像你天天走一条路回家,路边有一排树,你不会刻意数它们,但某天少了一棵,你走到那个位置就会觉得"不对"。
而现在AI进了影像科。2025年,四川一家三甲医院的影像科主任公开发了一篇文章:把患者资料输入DeepSeek,30秒就能出一份全面的诊疗方案,条理清晰程度堪比资深主任医师。《柳叶刀》的一项研究显示,AI检测乳腺癌的准确率94.5%,放射科医生88%。在效率上,AI工具能把医生日阅片量从120例拉到400例,报告时间缩短60%。还有一项研究更直白:AI能自动识别出28%被专家标注为正常的胸片,对异常片的检出灵敏度高达99.1%。
不同研究中的具体数值因测试集和模型版本有所差异,但趋势高度一致:AI在"识别正常"和"检出异常"两个维度上,都已经达到或超越人类平均水平。
如果AI已经能筛掉将近三成正常片,那新人去哪看这三成?
AI替掉了最枯燥的那部分工作。但那个"0.3秒察觉异常"的眼力,恰好是从这些最枯燥的部分里长出来的。Nature Medicine还发现了一个更残酷的细节:当AI出现误判时,58%的医生会不自觉地跟着错误走,这个比例跟经验年限无关。换个说法,过度依赖AI以后,连资深医生的判断力都在退化,更不用说那些还在长判断力的住院医了。
第二个被断了的新手村:客服的"通话地狱"。
你网购了一条裙子,跟客服说"颜色不对"。你不是真的要退货,你想说的是"这颜色差到让人觉得被侮辱了"。
做了三年的老客服,能从打字节奏、用词选择、沉默时长里听懂这句话。她的耳朵是在几千个难缠客户的电话里磨出来的。AI替她接了那些电话,效率更高,态度更好,永不疲倦。但以后去哪磨耳朵?这就像一个做了十年的水管工,你告诉他"现在有一种永不漏水的新材料,不需要你修了",他省下的是体力活,丢掉的是手指一摸管壁就知道水压对不对的那种直觉。
第三个被断了的新手村:程序员的"屎山"。
每个程序员都有一段爬"屎山"的日子,维护别人三年前写的、注释里全是@TODO的老代码。痛苦至极,但你熬过来以后,会获得一种无法传授的本事:一眼就能看出一个函数是在"干活"还是在"埋雷"。
现在GitHub Copilot重写模块比你读还快。入职两年的工程师,可能从没真正爬过一座屎山。代码写得很干净,但少了一样东西——闻到坏代码的那种直觉。
还有一个群体容易被忽略:中层管理者。
AI能生成周报、能分配任务、能预测项目风险,但AI不会在开完一个烂会之后,凭直觉知道"这个项目要黄了",然后在没人明说的情况下,悄悄启动Plan B。那种"闻出项目要出事"的嗅觉,同样是在无数次烂会里长出来的——在无数次被上级骂"为什么没有提前发现"、在无数次半夜改方案、在无数次替团队背锅之后。
AI替他们写了周报,但写不出"我闻到了危险"的那种身体警报。
把三个案例放在一起看,它们共同指向的不是"学习路径被断了",而是更深一层的东西。
看一万张正常胸片,是为了长出异常感。AI替你筛掉了那些正常片——你的眼睛,慢慢钝了。
接几千通难缠电话,是为了长出听弦外之音的耳朵。AI替你接了所有电话——你的耳朵,慢慢聋了。
爬一座座屎山,是为了长出闻坏代码的嗅觉。AI替你重写了所有模块——你的嗅觉,慢慢没了。
这不是失业的问题,这是"不用则废"的问题。当人不再被迫去面对困难,那些需要时间和挫折才能长出来的判断力,会悄悄萎缩。就像一支从来不打仗的军队,装备再好,枪口也会慢慢往下垂。
AI替你省掉的每一秒枯燥,都在暗中标好了价格——那是你未来判断力的价格。
AI不能替代什么?
把前面两件事放在一起看,答案就出来了。
第一,被骂过才懂的"弦外之音"。
客户说"方案还不错",AI判定为正面评价。做十年的老销售知道,这句话的意思是"我看了三页就关了,但不想得罪你"。
这层翻译不是学出来的,是碰过几百次壁长出来的。AI算得出"正确",算不出弦外。
第二,失败过才有的"手感"。
AI能分析一百个项目的成败数据,但它不会凌晨三点醒过来,想"如果当时选了另一条路呢"。
后悔腐蚀人,也让人下一次做出更精准的判断,那种判断带着身体记忆的重量。AI没有后果,所以没有后悔,所以没有那种知道下一脚踩下去是什么感觉的手感。
第三,说"别这么做"的底气。
AI能给方案、给论据、给风险评估。但它不会在会议室里站起来说:"不对。这个方向我试过,不行。"
这句话背后不是数据,是摔过之后长出来的骨头。AI能说"风险系数高",但说不出"我知道,因为是我自己摔的"。
那我怎么办?
第一件事:用AI,但不把脑子交给它。
让AI写代码,但你必须读它写的每一行。让AI回客户,但你必须听它回的每一句话。让AI做初稿,但你必须是那个定稿的人。
原则只有一条:AI是你的执行层,你不是AI的橡皮图章。每件AI替你干的事,你必须有能力判断它干得好不好,而这个判断力,恰好来自你没有被AI省掉的那些练习时刻。
第二件事:故意保留一点低效。
有些时候故意不用AI,自己从头做一遍。不是为了省时间,是为了长出AI也没有的直觉。
比如给一份方案列大纲——AI能三秒给你一个完美的。但故意不用。自己对着空白文档,把一团乱麻的想法一根一根抽出来、排顺序。这个过程不产出什么看得见的成果,但它练的恰恰是那根"从混沌里理出结构"的神经。AI给你的大纲再完美,也替代不了你在空白页面上挣扎的那二十分钟。
第三件事:把你的判断力变成产品。
你不能跟AI比搜索、比归纳、比初稿。但你可以比一件事:你做过的事AI没做过,你犯过的错AI不会犯,因为它没有后果。把这些经历过后果的判断,提炼成你自己的一套方法。这是AI永远生成不了的东西。
第四件事:眼光放向新岗位。

你的护城河不是死守旧岗位,是看清旧岗位里哪些能力能迁移。
客服做久了,你知道"真正让人满意的是什么",这恰好是AI Evaluator最需要的能力。项目管多了,你知道"一个环节堵了怎么堵全身",这恰好是Agentic Workflow Architect的起点。
黄仁勋和Amodei争的是"消失多少个、新增多少个"的数字。
但数字从来不是答案。
答案不在数字里,在身体上——在那双不再需要看正常胸片的眼睛,在那对不再需要听难缠电话的耳朵,在那些不需要爬屎山就能写代码的手指头里。
AI替你省掉的每一秒枯燥,都在暗中标好了价格。
算法能算出正确的答案。算不出"对过、也错过、然后知道什么叫对"的人。
夜雨聆风