AI正在吃掉你的工作流-夜雨聆风

AI正在吃掉你的工作流

上个月，一个做了八年独立站的朋友发消息给我：他一个人加三个AI Agent，管着七个站点，月营收四十万美金。

我问他累不累。他说比以前带二十个人的团队轻松多了。

这让我想起Ben Thompson今年三月份那篇《Agents Over Bubbles》里的判断——他说AI不是什么泡沫，真正的拐点在于LLM的第三波进化：从ChatGPT的聊天窗口，到o1的推理内化，再到Claude Code和GPT Codex的自主执行。每一波都在吃掉更大的工作流。

坦白说，两年前大多数人还觉得AI就是个高级聊天机器人。你问一句它答一句，时不时还胡编乱造。去年呢，大家开始正经用它写代码、改文案、做翻译。但说实话，那还是”人类操盘、AI辅助”的老范式。

今年的变化才是真的刺激。

你的工作流，正在被重新发明

先说一个数据。NVIDIA今年发布的《State of AI》报告调查了3200多家企业，48%的电信公司、47%的零售和消费品公司已经在用Agentic AI——不是那种被动问答的Copilot，而是能自己规划、调用工具、执行任务的AI Agent。64%的企业在”积极部署AI”，连金融行业这种最保守的领域都开始用上了。

这意味着什么？

很多人还在纠结”AI会不会取代某个岗位”的时候，真正值得关注的变化已经发生了：AI不会取代你，但它正在把整个做事的方式翻了个底朝天。

我拿我自己举个例子。之前帮一个做五金出口的老板搭AI询盘系统，他原来的流程是这样：业务员谷歌搜客户→群发开发信→等回复→手动录入CRM→跟报价→做合同。八个业务员，每天至少三小时在做纯手工操作。这不是累不累的问题，而是你派八个人去拧螺丝，全世界的螺丝都被机器拧完了你还在拧。

我们把他的整个流程拆了。AI爬虫自动找目标客户，Agent写个性化开发信（不用模板，根据客户网站内容生成），自动分类意向等级，高意向客户自动推送到老板手机上。

结果？他砍掉了六个业务员。不是裁员——一转做客户关系维护，一去搞产品升级，另外四个是自然离职后没补招。营收没降，反而涨了30%。

别理解错了，我不是在吹”AI必胜”。说实话这里面的坑也不少，后面我会聊。

第三波：AI从”副驾驶”变成了”主驾驶”

Ben Thompson把LLM的进化概括成三波拐点，我觉得这个框架特别有味。

第一波，2022年11月，ChatGPT把大语言模型从实验室玩具变成了全民话题。但那时候的模型有个致命缺陷：它会编瞎话。你用它可以，但你得时时刻刻盯着，像带一个聪明但不靠谱的实习生。

第二波，2024年9月，OpenAI的o1模型搞出了”推理内化”。说白了，它在给你答案之前会自己在内部先过一遍、查错、推敲，而不是张口就来。这解决了一个关键问题——可靠性。模型的出错率降了，你就可以放心让它做更多的事。

第三波，才是真正的质变。2025年底到2026年初，Anthropic的Opus 4.5和OpenAI的GPT-5.2-Codex相继发布。本来大家没觉得有什么惊天动地的变化——毕竟一两个百分点的基准测试提升，不是很正常嘛？直到开发者们发现：Claude Code可以自己搭项目了。不是那种帮你写个小函数的辅助，而是你给它一个需求，它自己拆解、建文件、写代码、跑测试、修bug、部署。整套做完。

怎么说呢，就是从”你手把手指挥AI做事”变成了”你定目标、AI自己想办法达成”。

这种转变的核心技术，行业里现在叫”LLM大脑 + Code肌肉”的混合架构。大脑负责理解模糊需求、推理和创意，肌肉负责精确执行。不是你让AI自由发挥，而是每一步操作都要经过代码级别的验证。换句话说，AI不再只是一个只会说话的脑子，它有了能动的四肢。

这让我想起上个月看到的一组对比：SWE-Bench基准测试上，2024年初最好的AI编程工具只能完成不到30%的工程任务。到2026年4月，Claude Opus 4.7做到了64.3%的SWE-Bench Pro完成率。一年翻了不止一倍。

这速度，真的绝了。

巨头们的豪赌：7000亿美金的信仰

光说技术变化还不够。你再看钱在往哪跑，就知道这事儿有多真。

根据今年2月Stratechery的分析，亚马逊、谷歌、Meta三家在2026年的合并AI基建资本支出，超过7000亿美元。你知道这是什么概念吗？接近美国国防部年度预算的三分之二。

一个科技行业说自己花的钱相当于一个超级大国的军费支出，你说他们是在玩票还是在下注？

更耐人寻味的是，Ben Thompson还专门分析了一嘴：谷歌砸钱是最有道理的——他们的云计算业务增长爆炸，而且搜索广告加LLM的商业模式天然闭环。亚马逊砸钱就让人有点不安，云服务利润挤压加上零售利润率薄，这投资回报什么时候回来不好说。

但不管怎么样，7000亿美元砸下去不是为了让你继续把AI当聊天工具用的。

斯坦福今年的AI Index报告还有个数据让我印象很深：截至2026年3月，Anthropic的顶级模型在基准测试上只领先中国最好的模型2.7%。注意，不是领先50%，是2.7%。而就在一年前，2025年2月，DeepSeek-R1曾短暂追平了美国顶尖水平。

翻译一下：全球AI能力在快速趋同。以前是”美国一骑绝尘”，现在是”大家都在第一梯队”。这意味着什么？靠模型本身赚钱越来越难，真正的竞争变成了谁能把AI能力嵌入到业务工作流里面去。

我跟你说，这个判断太重要了。

我之前跟一个做跨境电商的朋友聊，他2024年花了大价钱买了某大厂的AI客服方案，结果用下来还不如人工——因为那个AI只会套话术模板，遇到稍微复杂一点的问题就崩。说白了，有模型不等于有解决方案。

真正把AI用好的团队，不是在”用AI”——他们在”被AI替代之后重新设计流程”。这两者的区别，比你想的大得多。

到底什么是Agent？一句话讲清楚

很多人把”Agent”这个词挂在嘴边，但你问他们到底什么是Agent，回答基本上就是：”就是AI能自己干活了嘛。”

不精准。准确说是：Agent是一个”大脑+手+神经系统”的完整系统。大脑是大模型，手是它能调用的工具（浏览器、代码执行器、数据库、API），神经系统是编排层——决定什么时候思考、什么时候行动、什么时候检查结果、什么时候回退纠正。

2026年的技术关键点，行业里有一个共识叫”确定性交付”。就是说AI Agent不能是一个”可能做对也可能做错”的概率机器——它在关键操作上必须有确定性的代码验证。

具体怎么做？”LLM大脑 + Code肌肉”。

举个例子：你说”帮我把上个月的销售数据做个报表发给李总”。Agent的工作不是直接用一个prompt生成一段文字——它先理解你的意图（大脑），然后找到数据库、写SQL查询、跑统计、验证数据正确性（代码），再调用邮件API发送（代码），每一步都有检查点。如果数据查询返回空值，它会追溯回去找问题，而不是随便编个数。

这就是为什么Claude Code这类工具在开发者圈子里炸了——不是因为语言能力强，而是因为它能真的改文件、执行命令、读报错、自己修bug、再从头跑一遍。你喝杯咖啡回来，任务做完了。

我之前帮一个上海做家居出口的公司做了一套AI自动跟单Agent，本质上就是这个逻辑在贸易场景里的应用。客户下PO之后，AI Agent自动读邮件附件里的PO单、解析产品明细、比对库存、生成生产单、推送到工厂微信群、监控交期节点。中间任何一步出现异常，自动标记并推送给对应负责人。

说个实话，这套系统上线的头一个月出了五次bug——全是API返回格式不一致导致Agent误判。但跟人工出错率比呢？以前每个月光是PO录入错误就有十几处。Agent上线三个月后，PO录入错误率降到零。

反正重点不是AI不出错，是它出的错有迹可循、能快速修正——这才是”确定性交付”的意思。

人与Agent的关系，正在重新定义

这可能是2026年最重要，但最少被人认真讨论的话题。

当Agent能自己做事了，人的角色就彻底变了。你不是”操作AI的人”，你变成了”设定目标的人”。

听起来很玄乎，其实已经在发生。开发者的工作不再是写代码，而是写prompt和做代码审查——有人管这个叫”Prompt Architect”和”System Debugger”。设计师的工作不再是一笔一画地做图，而是定义视觉方向、审核AI产出、做关键创意决策。

这不是”AI让人失业”，而是”会用AI的人，比不会用的人效率高出一个数量级”。但问题是——当效率差距大到一两个数量级的时候，”机会不平等”会变成一个真实的焦虑。

Stanford AI Index今年特意指出：公众对AI的态度更加分裂了。企业对AI的投资在暴增，但普通人的情绪却在恶化——尤其是美国，一些地方政府开始禁建数据中心。这俩趋势是反着走的：70%的企业在加速部署，同时42%的企业还在”评估阶段”，连门都没入。

这中间的断崖，说白了不是技术问题，是认知问题。

去年有个客户跟我说过一句话，我到现在还记得：”我不是不想用AI，我是不知道从哪里开始。”他是做玩具出口的，年销两个亿。他不是没见过AI方案，他见过五六家，每家说的都是”我们的AI能做XXX”，但他需要的是有人告诉他：你的生意从哪里切第一刀。

这其实也是我今年在帮外贸企业做的最多的事——不是卖工具，是帮他们重新画一遍业务流程图。把流程画出来之后，哪些环节可以Agent化，哪些环节必须人来做判断，一清二楚。

以前这些环节之间的衔接靠人力协调——邮件、电话、微信群、Excel表格。现在是Agent直接调用API或解析邮件，人力从”传递信息”变成”监督和决策”。

打个不太恰当的比喻：过去AI是螺丝刀，你得自己动手拧。现在AI是一条流水线，你只要告诉它终产品长什么样就行。问题是——大部分人的组织架构和工作习惯，还停留在”手工作坊”时代。

不是所有Agent都靠谱，这里面坑太多了

写到这里我必须补几句，免得你以为我把AI Agent吹上天了。

之前帮一个服装贸易公司做AI客服Agent，花了一个月把产品知识库搭好、对话流程训练好。结果上线第一周，有一个客户问”这个面料会不会缩水”，Agent从知识库里调出一段完全错误的面料说明，直接回复”不会缩水”。客户买回去洗了一次，缩了三公分，闹到要退货退款。

查了一圈，原因特别朴实：知识库源数据错了。错不在模型，错在源头。

这就是Agent时代最大的悖论：你越是让AI自动执行，它对数据的依赖就越深。数据质量差，AI就做错事——而且比人做错事的范围大得多。一个人一天做错三件事。一个Agent配错一个参数，可能影响三百个订单。

还有个坑是”过度Agent化”。不是所有环节都适合AI，判断什么时候需要人介入是一种新的管理能力。我一个客户一开始想把整个外贸流程全部Agent化，从找客户到签合同到发货到售后全栈AI。我们讨论了两天，最后砍掉了一半——有些环节比如大客户谈判、样品确认、质量投诉处理，现阶段AI根本搞不定。

你猜怎么着？反而因为这些环节没有被Agent化，人可以把精力集中在这几个高价值的节点上，整个效率比全部自动化还高。

所以说到底，Agent不是在替代人，它是在替代”人不该做的事”。

工作流的终局是什么

NVIDIA报告里有个数字：53%的企业说AI带来的最大影响是员工生产力提升。但如果你仔细看那些ROI最高的案例，它们有一个共同点——不是”给员工配了AI工具”，而是”用AI Agent重构了整个业务流程”。

西门子和百事可乐的合作案例就很典型。把百事在美国的几家工厂和仓库建成高精度的3D数字孪生，AI Agents在虚拟环境里模拟产线调整、识别瓶颈，在实际动手改造之前就能发现90%的潜在问题。结果？初始部署的几家工厂吞吐量提升20%，资本支出降低10%到15%。

不是”用AI辅助决策”这种虚的——是真金白银的效率和成本。

回到我在做的事情。外贸行业的AI落地，现在正在从”能做”变成”必须做”。

2026年，如果你还在手动搜索客户、群发模板邮件、Excel管订单，你面对的根本不是AI好不好用的问题。而是你的竞争对手可能一个人加三个Agent就把你二十个人的活干完了。

我以前会说”要拥抱AI、跟上时代”。现在不这么说了。现在我会说：先把你今天的工作流程用纸画出来，然后一个一个环节问自己——”这一步到底需要人的判断，还是只需要信息传递？”

你会发现，至少一半的环节可以Agent化。这不是危言耸听。

未来两年的工作流终局，我判断是”人-机混合编排”——人的价值往两个极端走：一是最顶层的战略判断和创意决策，二是最底层的人情世故和关系维护。中间所有信息处理、流程协调、例行决策，全部会被Agent吃掉。

听着可能不舒服，但说实话，我反而觉得这对大多数普通人来说是件好事。因为你终于不用把时间花在那些”拧螺丝”式的工作上了。

前提是，你得愿意开始第一步。

✍️ 本文由麻豆鹿原创，欢迎转发分享。