AI Agent越多越乱?曾国藩160年前就有答案

AI Agent越多越乱？曾国藩160年前就有答案

大多数企业管AI agent的方式，和管人没有任何区别。派个任务、给个权限、出了事再追责。2026年3月，Meta内部一个AI agent自动发布了一条错误的技术建议，敏感数据权限被放大了两个小时。事后复盘，问题不在于agent做错了什么，而在于从一开始就没有人定义过它该做什么、不该做什么。Meta用管人的方式管了一个不是人的东西。

管人可以靠默契、靠经验、靠"你懂的"。管agent不行。Agent没有常识，没有直觉，也不会在犯错之前自己踩刹车。你不告诉它边界在哪，它就没有边界。

这个区别看起来简单，但绝大多数企业到今天还没有真正消化它。

管人那套，为什么在agent身上失效

某企业负责人跟我说过一件事。他会把20个PDF文档一次性扔给Agent，让它告诉他是否发现了他想发现的答案。

这是一个极其典型的"工具心态"。你把一摞文件扔给一个下属，下属会问你："老板，你想找什么方向的信息？判断标准是什么？'发现'到什么程度算发现了？"人会追问，会自己补全上下文。Agent不会。它会老老实实地扫完20个PDF，给你一个看起来像回事但你无法评估对错的答案。因为你从来没有定义过它该关注什么维度、判断标准是什么、"发现"意味着什么。全靠它自己猜。

这种"工具心态"在企业里已经蔓延成了系统性问题。Salesforce 2026年对1,050位IT负责人的调查显示，50%的企业agent在孤岛里运行，没有协调、没有共享上下文、没有统一治理。只有18%的企业有完整的agent资产清册。换句话说，超过八成的企业对"我们到底有多少个agent在跑"这个问题，给不出准确答案。

数量失控还在加速。IBM 2026年预测，到年底大型企业将运行超过1,600个AI agent。没有治理的agent在默默吃钱：重复的API调用、重叠的计算任务、冗余的数据抓取。市场部的客户画像agent和销售部的CRM agent可能在用不同的模型、不同的数据源，分别回答同一个客户的同一个问题。没人知道答案是否一致，也没人知道两边各花了多少token。业内管这个叫"token hemorrhaging"，token失血。反过来，投入了编排和治理的企业，agent扩展速度快13倍，AI投资回报高20%。

80%的IT专业人员表示，他们已经目睹agent执行了未授权或超预期的操作。你的agent有岗位说明书吗？有汇报线吗？有权限边界吗？如果没有，它就是在真空中运行。而真空不会持续太久，迟早会被事故填满。

曾国藩的范式：不是管理升级，是另起炉灶

到这里，大多数人的直觉反应是：那就建一个中央控制平台，把所有agent统一纳管。集中管控，统一调度。说实话，我们最初也是这么想的。但项目做多了之后发现，"管"不是真正的办法。一管就死。真正有效的不是管控，是在起点就定义清楚每个agent为谁服务、解决什么问题、边界在哪。Agent有自主性，这种自主性是它的价值所在，你要做的不是压制它，而是给它装上轨道。管理agent不是硬性管控，是协作流程的设计。

在我看来，"集中管控"这个思路方向反了。我想把"为什么反了"说得更清楚一些。

管人，靠的是什么？是几十年积累的经验、直觉、对人性的判断。你知道哪个下属需要盯紧、哪个可以放手，你知道什么话该说什么话不该说，你知道一个人的表情变化意味着什么。这些全是隐性知识，存在你脑子里，从来没有被写成过文档。你不需要写，因为管人靠的就是这种默契。

但agent不吃这套。它没有默契，没有经验直觉，也不会"看你脸色行事"。你脑子里那些管人的隐性know-how，对agent来说等于不存在。管agent需要的是一种全新范式：把你脑子里的隐性经验显性化、结构化，变成agent能执行的规范。这不是"管理升级"，这是另起一套炉灶。

1853年的曾国藩面对的问题，结构上和今天的CEO几乎同构。清朝绿营兵号称80万人，"兵与兵不相知，兵与将不相习"。人很多，没有编制、没有纪律、没有责任归属。太平军一冲就溃。

绿营的问题不是缺一个更好的司令部。曾国藩试过整合绿营，行不通。问题在于整个组织范式里，没有人的经验和判断被结构化沉淀下来。每个兵不知道自己归谁管，每个将不知道自己该对谁的行为负责，打仗全凭临场发挥。这是19世纪版的agent sprawl：规模庞大，治理为零。

所以曾国藩的解法不是修修补补，是另起炉灶建新范式。这套编制的核心逻辑，比任何"AI governance platform"都值得CEO们认真看看。

层层招募，层层负责。 大帅选统领，统领选营官，营官选哨官，哨官选什长，什长选士兵。每一级对上一级负责，每一个兵都能追溯到"谁招的他"。映射到agent治理就是一条：每个agent有一个明确的Owner，这个Owner是业务负责人，不是IT部门。不存在"无主agent"。

将死军散，利益绑定。 湘军最狠的规矩是营官战死，整营就地解散。不是打散重编，是遣散。听起来残酷，但设计极其精巧：保护长官不再是道德号召，而是每个士兵的切身利益。长官活着，有饭吃有前途；长官死了，你从这支军队消失。道德和利益绑在一起，执行力就有了。

回看Meta的SEV1事故，真正该问的问题是：谁批准让这个agent有权限修改数据访问控制？如果有明确的Owner，并且Owner要为agent的越权行为承担后果，审批的谨慎程度会完全不同。IDC 2026年预测，60%的AI项目失败将源于治理缺口而非模型性能。治理缺口的核心就是"出了事不知道找谁"。将死军散的逻辑放到今天就是：agent出事，直接问责部署它的业务负责人，不是追IT的责任，是追决策者的责任。

精不贵多，精兵厚饷。 这一条我想展开讲，因为它恰恰是大多数企业最容易踩的坑。

某次交流中有人说了一句话让我印象很深："量大量多不关键，关键在于每一个agent是不是真的能在非常具体的问题上解决问题、拿到结果。"这个判断比很多治理框架都精准。

曾国藩选兵标准极其严苛，只要"朴实壮健"的山地农民，"油头滑面、有市井气者概不收用"。但入选的兵，薪俸是绿营的3到4倍。他舍得花钱，但只肯花在对的人身上。他的老部下王錱急于扩军，大量招募，质量参差。曾国藩反复告诫，贪多必乱。后来王錱部确实出了问题，军纪松弛、战力下降，印证了曾国藩的判断。

放到今天的agent部署场景里，很多企业在董事会上汇报"我们已经部署了200个AI agent"，把数量当成数字化成绩单。但搭出来是一回事，能在真实商业场景中拿到结果才算数。200个半成品agent在孤岛里空转消耗的资源，远超15个精选agent在编制里创造的价值。

Gartner有一个预测值得放在这个语境里看：到2028年，40%的企业应用将嵌入AI agent。规模扩张是不可逆的趋势，这恰恰让精兵策略变得更重要。趋势越猛，纪律越关键。盲目堆数量的企业，大概率会在两年内经历一次痛苦的清洗。

还有一个反面教训。攻克天京后，曾国藩用一个月裁撤了一半湘军，约2.5万人。他的判断是"再用则浊，三用则涸"：士气已竭、纪律松弛的军队不如直接解散，继续用只会腐化。企业里那些跑了半年没人看、输出无人用、数据权限还在的僵尸agent，就是你的"浊军"。不裁，就是在积累安全隐患和成本黑洞。

回到开头的判断：管agent和管人是两套范式。编制不是一个管理术语，是一套把know-how结构化的方法。没有这套方法，你管的不是agent，是一群在真空中随机运行的程序。

范式怎么落地

说回现实。大多数企业不可能像曾国藩那样推倒重建。编制思维可以渐进式落地，不需要一个governance framework，从四个具体动作开始就够了。但这四个动作有顺序，顺序本身就是方法论。

第一步，定Owner，定问题。 先别急着建governance committee。我见过企业技术部门搭了治理委员会，流程画得很漂亮，但上面依然回答不了一个最基本的问题："这个agent为什么存在？"委员会管的是流程，但agent的起点问题不是流程能回答的，得业务负责人自己想清楚。所以真正的起点不是"先数你有多少个agent"，而是"先问为什么要有这个agent"。每一个agent的存在理由，都要能回溯到一个具体的业务问题和一个具体的负责人。Owner不是IT，是业务方。就像曾国藩的营官自选兵勇，谁部署的agent谁负责。Owner对agent的权限范围、数据边界、成本预算、产出质量负全责。这一条落地了，一半的治理问题大概率会自然消解。

第二步，清点存量。 如果你的企业已经跑了一堆agent，做一次盘点。你的企业现在有多少个agent在运行？如果答案是"不知道"，这就是值得优先做的事。行业数据显示，只有18%的企业有完整的agent资产清册。没有清册，后面所有动作都是在盲区里操作。

第三步，裁冗。 砍掉没有Owner和明确问题定义的"浊军"。判断标准可以参考曾国藩的逻辑：跑了超过三个月、没有人review过输出、没有明确业务目标的agent，大概率就是你的浊军。不妨做一次"agent断舍离"，停掉它们一周，看谁来问。没人问，就是没人用。真正创造价值的agent停一天就有人叫，这是最诚实的检验。

S&P Global数据显示，42%的公司在2025年砍掉了大部分AI项目。IDC的统计更直接：88%的AI agent试点项目永远到不了生产环境。那些半死不活的试点agent，占着API额度、消耗着算力、保留着数据权限，却没有人为它们的存在负责。及时止损不丢人，拖着僵尸agent积累安全债才是真正的浪费。

第四步，设限。 Teleport 2026年的研究给出了一个数字：权限过度开放的AI系统，安全事故率是最小权限系统的4.5倍。一个agent只需要拥有完成其任务所需的最低权限，就像湘军哨官只管自己的八队，不能越过营官调动其他哨的兵力。

Microsoft 365 Copilot的零点击漏洞值得所有管理者了解。2025年6月披露的CVE-2025-32711，CVSS评分9.3。攻击者只需发一封暗藏指令的邮件，Copilot在做例行邮件摘要时就会自动执行嵌入的恶意操作，因为它有权限访问OneDrive、SharePoint和Teams的全部内容。没有人点击了什么，没有人犯了什么错误，漏洞完全来自权限给得太大。防线不在你手里了。

未来的判断

曾国藩裁撤湘军时写过一段话，大意是：湘军锐气已泄，好的兵将陆续散去，留下来的骄纵不服管束，中间还掺杂了游勇奸民。把这段话里的"湘军"换成"AI agent"，"游勇奸民"换成"僵尸agent和shadow AI"，对2026年的大多数企业完全适用。

兵贵精不贵多。Agent也一样。

在我的判断中，未来两年AI agent领域最大的分水岭不在模型性能，不在应用场景，而在于谁先把管人的隐性默契转换成了管agent的显性范式。管人靠默契，管agent靠范式。大多数企业还没有开始这个转换。

如果你也在思考企业AI agent的治理问题，可以关注公众号「顾青谈增长」，我会持续分享这个领域的判断和实践。