AI正在吃掉你的工作流
上个月,一个做了八年独立站的朋友发消息给我:他一个人加三个AI Agent,管着七个站点,月营收四十万美金。
我问他累不累。他说比以前带二十个人的团队轻松多了。
这让我想起Ben Thompson今年三月份那篇《Agents Over Bubbles》里的判断——他说AI不是什么泡沫,真正的拐点在于LLM的第三波进化:从ChatGPT的聊天窗口,到o1的推理内化,再到Claude Code和GPT Codex的自主执行。每一波都在吃掉更大的工作流。
坦白说,两年前大多数人还觉得AI就是个高级聊天机器人。你问一句它答一句,时不时还胡编乱造。去年呢,大家开始正经用它写代码、改文案、做翻译。但说实话,那还是”人类操盘、AI辅助”的老范式。
今年的变化才是真的刺激。
你的工作流,正在被重新发明

先说一个数据。NVIDIA今年发布的《State of AI》报告调查了3200多家企业,48%的电信公司、47%的零售和消费品公司已经在用Agentic AI——不是那种被动问答的Copilot,而是能自己规划、调用工具、执行任务的AI Agent。64%的企业在”积极部署AI”,连金融行业这种最保守的领域都开始用上了。
这意味着什么?
很多人还在纠结”AI会不会取代某个岗位”的时候,真正值得关注的变化已经发生了:AI不会取代你,但它正在把整个做事的方式翻了个底朝天。
我拿我自己举个例子。之前帮一个做五金出口的老板搭AI询盘系统,他原来的流程是这样:业务员谷歌搜客户→群发开发信→等回复→手动录入CRM→跟报价→做合同。八个业务员,每天至少三小时在做纯手工操作。这不是累不累的问题,而是你派八个人去拧螺丝,全世界的螺丝都被机器拧完了你还在拧。
我们把他的整个流程拆了。AI爬虫自动找目标客户,Agent写个性化开发信(不用模板,根据客户网站内容生成),自动分类意向等级,高意向客户自动推送到老板手机上。
结果?他砍掉了六个业务员。不是裁员——一转做客户关系维护,一去搞产品升级,另外四个是自然离职后没补招。营收没降,反而涨了30%。
别理解错了,我不是在吹”AI必胜”。说实话这里面的坑也不少,后面我会聊。
第三波:AI从”副驾驶”变成了”主驾驶”
Ben Thompson把LLM的进化概括成三波拐点,我觉得这个框架特别有味。
第一波,2022年11月,ChatGPT把大语言模型从实验室玩具变成了全民话题。但那时候的模型有个致命缺陷:它会编瞎话。你用它可以,但你得时时刻刻盯着,像带一个聪明但不靠谱的实习生。
第二波,2024年9月,OpenAI的o1模型搞出了”推理内化”。说白了,它在给你答案之前会自己在内部先过一遍、查错、推敲,而不是张口就来。这解决了一个关键问题——可靠性。模型的出错率降了,你就可以放心让它做更多的事。
第三波,才是真正的质变。2025年底到2026年初,Anthropic的Opus 4.5和OpenAI的GPT-5.2-Codex相继发布。本来大家没觉得有什么惊天动地的变化——毕竟一两个百分点的基准测试提升,不是很正常嘛?直到开发者们发现:Claude Code可以自己搭项目了。不是那种帮你写个小函数的辅助,而是你给它一个需求,它自己拆解、建文件、写代码、跑测试、修bug、部署。整套做完。
怎么说呢,就是从”你手把手指挥AI做事”变成了”你定目标、AI自己想办法达成”。
这种转变的核心技术,行业里现在叫”LLM大脑 + Code肌肉”的混合架构。大脑负责理解模糊需求、推理和创意,肌肉负责精确执行。不是你让AI自由发挥,而是每一步操作都要经过代码级别的验证。换句话说,AI不再只是一个只会说话的脑子,它有了能动的四肢。
这让我想起上个月看到的一组对比:SWE-Bench基准测试上,2024年初最好的AI编程工具只能完成不到30%的工程任务。到2026年4月,Claude Opus 4.7做到了64.3%的SWE-Bench Pro完成率。一年翻了不止一倍。
这速度,真的绝了。
巨头们的豪赌:7000亿美金的信仰
光说技术变化还不够。你再看钱在往哪跑,就知道这事儿有多真。
根据今年2月Stratechery的分析,亚马逊、谷歌、Meta三家在2026年的合并AI基建资本支出,超过7000亿美元。你知道这是什么概念吗?接近美国国防部年度预算的三分之二。
一个科技行业说自己花的钱相当于一个超级大国的军费支出,你说他们是在玩票还是在下注?
更耐人寻味的是,Ben Thompson还专门分析了一嘴:谷歌砸钱是最有道理的——他们的云计算业务增长爆炸,而且搜索广告加LLM的商业模式天然闭环。亚马逊砸钱就让人有点不安,云服务利润挤压加上零售利润率薄,这投资回报什么时候回来不好说。
但不管怎么样,7000亿美元砸下去不是为了让你继续把AI当聊天工具用的。
斯坦福今年的AI Index报告还有个数据让我印象很深:截至2026年3月,Anthropic的顶级模型在基准测试上只领先中国最好的模型2.7%。注意,不是领先50%,是2.7%。而就在一年前,2025年2月,DeepSeek-R1曾短暂追平了美国顶尖水平。
翻译一下:全球AI能力在快速趋同。以前是”美国一骑绝尘”,现在是”大家都在第一梯队”。这意味着什么?靠模型本身赚钱越来越难,真正的竞争变成了谁能把AI能力嵌入到业务工作流里面去。
我跟你说,这个判断太重要了。
我之前跟一个做跨境电商的朋友聊,他2024年花了大价钱买了某大厂的AI客服方案,结果用下来还不如人工——因为那个AI只会套话术模板,遇到稍微复杂一点的问题就崩。说白了,有模型不等于有解决方案。
真正把AI用好的团队,不是在”用AI”——他们在”被AI替代之后重新设计流程”。这两者的区别,比你想的大得多。
到底什么是Agent?一句话讲清楚
很多人把”Agent”这个词挂在嘴边,但你问他们到底什么是Agent,回答基本上就是:”就是AI能自己干活了嘛。”
不精准。准确说是:Agent是一个”大脑+手+神经系统”的完整系统。大脑是大模型,手是它能调用的工具(浏览器、代码执行器、数据库、API),神经系统是编排层——决定什么时候思考、什么时候行动、什么时候检查结果、什么时候回退纠正。
2026年的技术关键点,行业里有一个共识叫”确定性交付”。就是说AI Agent不能是一个”可能做对也可能做错”的概率机器——它在关键操作上必须有确定性的代码验证。
具体怎么做?”LLM大脑 + Code肌肉”。
举个例子:你说”帮我把上个月的销售数据做个报表发给李总”。Agent的工作不是直接用一个prompt生成一段文字——它先理解你的意图(大脑),然后找到数据库、写SQL查询、跑统计、验证数据正确性(代码),再调用邮件API发送(代码),每一步都有检查点。如果数据查询返回空值,它会追溯回去找问题,而不是随便编个数。
这就是为什么Claude Code这类工具在开发者圈子里炸了——不是因为语言能力强,而是因为它能真的改文件、执行命令、读报错、自己修bug、再从头跑一遍。你喝杯咖啡回来,任务做完了。
我之前帮一个上海做家居出口的公司做了一套AI自动跟单Agent,本质上就是这个逻辑在贸易场景里的应用。客户下PO之后,AI Agent自动读邮件附件里的PO单、解析产品明细、比对库存、生成生产单、推送到工厂微信群、监控交期节点。中间任何一步出现异常,自动标记并推送给对应负责人。
说个实话,这套系统上线的头一个月出了五次bug——全是API返回格式不一致导致Agent误判。但跟人工出错率比呢?以前每个月光是PO录入错误就有十几处。Agent上线三个月后,PO录入错误率降到零。
反正重点不是AI不出错,是它出的错有迹可循、能快速修正——这才是”确定性交付”的意思。
人与Agent的关系,正在重新定义
这可能是2026年最重要,但最少被人认真讨论的话题。
当Agent能自己做事了,人的角色就彻底变了。你不是”操作AI的人”,你变成了”设定目标的人”。
听起来很玄乎,其实已经在发生。开发者的工作不再是写代码,而是写prompt和做代码审查——有人管这个叫”Prompt Architect”和”System Debugger”。设计师的工作不再是一笔一画地做图,而是定义视觉方向、审核AI产出、做关键创意决策。
这不是”AI让人失业”,而是”会用AI的人,比不会用的人效率高出一个数量级”。但问题是——当效率差距大到一两个数量级的时候,”机会不平等”会变成一个真实的焦虑。
Stanford AI Index今年特意指出:公众对AI的态度更加分裂了。企业对AI的投资在暴增,但普通人的情绪却在恶化——尤其是美国,一些地方政府开始禁建数据中心。这俩趋势是反着走的:70%的企业在加速部署,同时42%的企业还在”评估阶段”,连门都没入。
这中间的断崖,说白了不是技术问题,是认知问题。
去年有个客户跟我说过一句话,我到现在还记得:”我不是不想用AI,我是不知道从哪里开始。”他是做玩具出口的,年销两个亿。他不是没见过AI方案,他见过五六家,每家说的都是”我们的AI能做XXX”,但他需要的是有人告诉他:你的生意从哪里切第一刀。
这其实也是我今年在帮外贸企业做的最多的事——不是卖工具,是帮他们重新画一遍业务流程图。把流程画出来之后,哪些环节可以Agent化,哪些环节必须人来做判断,一清二楚。
以前这些环节之间的衔接靠人力协调——邮件、电话、微信群、Excel表格。现在是Agent直接调用API或解析邮件,人力从”传递信息”变成”监督和决策”。
打个不太恰当的比喻:过去AI是螺丝刀,你得自己动手拧。现在AI是一条流水线,你只要告诉它终产品长什么样就行。问题是——大部分人的组织架构和工作习惯,还停留在”手工作坊”时代。
不是所有Agent都靠谱,这里面坑太多了
写到这里我必须补几句,免得你以为我把AI Agent吹上天了。
之前帮一个服装贸易公司做AI客服Agent,花了一个月把产品知识库搭好、对话流程训练好。结果上线第一周,有一个客户问”这个面料会不会缩水”,Agent从知识库里调出一段完全错误的面料说明,直接回复”不会缩水”。客户买回去洗了一次,缩了三公分,闹到要退货退款。
查了一圈,原因特别朴实:知识库源数据错了。错不在模型,错在源头。
这就是Agent时代最大的悖论:你越是让AI自动执行,它对数据的依赖就越深。数据质量差,AI就做错事——而且比人做错事的范围大得多。一个人一天做错三件事。一个Agent配错一个参数,可能影响三百个订单。
还有个坑是”过度Agent化”。不是所有环节都适合AI,判断什么时候需要人介入是一种新的管理能力。我一个客户一开始想把整个外贸流程全部Agent化,从找客户到签合同到发货到售后全栈AI。我们讨论了两天,最后砍掉了一半——有些环节比如大客户谈判、样品确认、质量投诉处理,现阶段AI根本搞不定。
你猜怎么着?反而因为这些环节没有被Agent化,人可以把精力集中在这几个高价值的节点上,整个效率比全部自动化还高。
所以说到底,Agent不是在替代人,它是在替代”人不该做的事”。
工作流的终局是什么
NVIDIA报告里有个数字:53%的企业说AI带来的最大影响是员工生产力提升。但如果你仔细看那些ROI最高的案例,它们有一个共同点——不是”给员工配了AI工具”,而是”用AI Agent重构了整个业务流程”。
西门子和百事可乐的合作案例就很典型。把百事在美国的几家工厂和仓库建成高精度的3D数字孪生,AI Agents在虚拟环境里模拟产线调整、识别瓶颈,在实际动手改造之前就能发现90%的潜在问题。结果?初始部署的几家工厂吞吐量提升20%,资本支出降低10%到15%。
不是”用AI辅助决策”这种虚的——是真金白银的效率和成本。
回到我在做的事情。外贸行业的AI落地,现在正在从”能做”变成”必须做”。
2026年,如果你还在手动搜索客户、群发模板邮件、Excel管订单,你面对的根本不是AI好不好用的问题。而是你的竞争对手可能一个人加三个Agent就把你二十个人的活干完了。
我以前会说”要拥抱AI、跟上时代”。现在不这么说了。现在我会说:先把你今天的工作流程用纸画出来,然后一个一个环节问自己——”这一步到底需要人的判断,还是只需要信息传递?”
你会发现,至少一半的环节可以Agent化。这不是危言耸听。
未来两年的工作流终局,我判断是”人-机混合编排”——人的价值往两个极端走:一是最顶层的战略判断和创意决策,二是最底层的人情世故和关系维护。中间所有信息处理、流程协调、例行决策,全部会被Agent吃掉。
听着可能不舒服,但说实话,我反而觉得这对大多数普通人来说是件好事。因为你终于不用把时间花在那些”拧螺丝”式的工作上了。
前提是,你得愿意开始第一步。
✍️ 本文由麻豆鹿原创,欢迎转发分享。
夜雨聆风