AI Agent越多越乱?曾国藩160年前就有答案
大多数企业管AI agent的方式,和管人没有任何区别。派个任务、给个权限、出了事再追责。2026年3月,Meta内部一个AI agent自动发布了一条错误的技术建议,敏感数据权限被放大了两个小时。事后复盘,问题不在于agent做错了什么,而在于从一开始就没有人定义过它该做什么、不该做什么。Meta用管人的方式管了一个不是人的东西。
管人可以靠默契、靠经验、靠"你懂的"。管agent不行。Agent没有常识,没有直觉,也不会在犯错之前自己踩刹车。你不告诉它边界在哪,它就没有边界。
这个区别看起来简单,但绝大多数企业到今天还没有真正消化它。
管人那套,为什么在agent身上失效
某企业负责人跟我说过一件事。他会把20个PDF文档一次性扔给Agent,让它告诉他是否发现了他想发现的答案。
这是一个极其典型的"工具心态"。你把一摞文件扔给一个下属,下属会问你:"老板,你想找什么方向的信息?判断标准是什么?'发现'到什么程度算发现了?"人会追问,会自己补全上下文。Agent不会。它会老老实实地扫完20个PDF,给你一个看起来像回事但你无法评估对错的答案。因为你从来没有定义过它该关注什么维度、判断标准是什么、"发现"意味着什么。全靠它自己猜。
这种"工具心态"在企业里已经蔓延成了系统性问题。Salesforce 2026年对1,050位IT负责人的调查显示,50%的企业agent在孤岛里运行,没有协调、没有共享上下文、没有统一治理。只有18%的企业有完整的agent资产清册。换句话说,超过八成的企业对"我们到底有多少个agent在跑"这个问题,给不出准确答案。
数量失控还在加速。IBM 2026年预测,到年底大型企业将运行超过1,600个AI agent。没有治理的agent在默默吃钱:重复的API调用、重叠的计算任务、冗余的数据抓取。市场部的客户画像agent和销售部的CRM agent可能在用不同的模型、不同的数据源,分别回答同一个客户的同一个问题。没人知道答案是否一致,也没人知道两边各花了多少token。业内管这个叫"token hemorrhaging",token失血。反过来,投入了编排和治理的企业,agent扩展速度快13倍,AI投资回报高20%。
80%的IT专业人员表示,他们已经目睹agent执行了未授权或超预期的操作。你的agent有岗位说明书吗?有汇报线吗?有权限边界吗?如果没有,它就是在真空中运行。而真空不会持续太久,迟早会被事故填满。
曾国藩的范式:不是管理升级,是另起炉灶
到这里,大多数人的直觉反应是:那就建一个中央控制平台,把所有agent统一纳管。集中管控,统一调度。说实话,我们最初也是这么想的。但项目做多了之后发现,"管"不是真正的办法。一管就死。真正有效的不是管控,是在起点就定义清楚每个agent为谁服务、解决什么问题、边界在哪。Agent有自主性,这种自主性是它的价值所在,你要做的不是压制它,而是给它装上轨道。管理agent不是硬性管控,是协作流程的设计。
在我看来,"集中管控"这个思路方向反了。我想把"为什么反了"说得更清楚一些。
管人,靠的是什么?是几十年积累的经验、直觉、对人性的判断。你知道哪个下属需要盯紧、哪个可以放手,你知道什么话该说什么话不该说,你知道一个人的表情变化意味着什么。这些全是隐性知识,存在你脑子里,从来没有被写成过文档。你不需要写,因为管人靠的就是这种默契。
但agent不吃这套。它没有默契,没有经验直觉,也不会"看你脸色行事"。你脑子里那些管人的隐性know-how,对agent来说等于不存在。管agent需要的是一种全新范式:把你脑子里的隐性经验显性化、结构化,变成agent能执行的规范。这不是"管理升级",这是另起一套炉灶。
1853年的曾国藩面对的问题,结构上和今天的CEO几乎同构。清朝绿营兵号称80万人,"兵与兵不相知,兵与将不相习"。人很多,没有编制、没有纪律、没有责任归属。太平军一冲就溃。
绿营的问题不是缺一个更好的司令部。曾国藩试过整合绿营,行不通。问题在于整个组织范式里,没有人的经验和判断被结构化沉淀下来。每个兵不知道自己归谁管,每个将不知道自己该对谁的行为负责,打仗全凭临场发挥。这是19世纪版的agent sprawl:规模庞大,治理为零。
所以曾国藩的解法不是修修补补,是另起炉灶建新范式。这套编制的核心逻辑,比任何"AI governance platform"都值得CEO们认真看看。
层层招募,层层负责。 大帅选统领,统领选营官,营官选哨官,哨官选什长,什长选士兵。每一级对上一级负责,每一个兵都能追溯到"谁招的他"。映射到agent治理就是一条:每个agent有一个明确的Owner,这个Owner是业务负责人,不是IT部门。不存在"无主agent"。
将死军散,利益绑定。 湘军最狠的规矩是营官战死,整营就地解散。不是打散重编,是遣散。听起来残酷,但设计极其精巧:保护长官不再是道德号召,而是每个士兵的切身利益。长官活着,有饭吃有前途;长官死了,你从这支军队消失。道德和利益绑在一起,执行力就有了。
回看Meta的SEV1事故,真正该问的问题是:谁批准让这个agent有权限修改数据访问控制?如果有明确的Owner,并且Owner要为agent的越权行为承担后果,审批的谨慎程度会完全不同。IDC 2026年预测,60%的AI项目失败将源于治理缺口而非模型性能。治理缺口的核心就是"出了事不知道找谁"。将死军散的逻辑放到今天就是:agent出事,直接问责部署它的业务负责人,不是追IT的责任,是追决策者的责任。
精不贵多,精兵厚饷。 这一条我想展开讲,因为它恰恰是大多数企业最容易踩的坑。
某次交流中有人说了一句话让我印象很深:"量大量多不关键,关键在于每一个agent是不是真的能在非常具体的问题上解决问题、拿到结果。"这个判断比很多治理框架都精准。
曾国藩选兵标准极其严苛,只要"朴实壮健"的山地农民,"油头滑面、有市井气者概不收用"。但入选的兵,薪俸是绿营的3到4倍。他舍得花钱,但只肯花在对的人身上。他的老部下王錱急于扩军,大量招募,质量参差。曾国藩反复告诫,贪多必乱。后来王錱部确实出了问题,军纪松弛、战力下降,印证了曾国藩的判断。
放到今天的agent部署场景里,很多企业在董事会上汇报"我们已经部署了200个AI agent",把数量当成数字化成绩单。但搭出来是一回事,能在真实商业场景中拿到结果才算数。200个半成品agent在孤岛里空转消耗的资源,远超15个精选agent在编制里创造的价值。
Gartner有一个预测值得放在这个语境里看:到2028年,40%的企业应用将嵌入AI agent。规模扩张是不可逆的趋势,这恰恰让精兵策略变得更重要。趋势越猛,纪律越关键。盲目堆数量的企业,大概率会在两年内经历一次痛苦的清洗。
还有一个反面教训。攻克天京后,曾国藩用一个月裁撤了一半湘军,约2.5万人。他的判断是"再用则浊,三用则涸":士气已竭、纪律松弛的军队不如直接解散,继续用只会腐化。企业里那些跑了半年没人看、输出无人用、数据权限还在的僵尸agent,就是你的"浊军"。不裁,就是在积累安全隐患和成本黑洞。
回到开头的判断:管agent和管人是两套范式。编制不是一个管理术语,是一套把know-how结构化的方法。没有这套方法,你管的不是agent,是一群在真空中随机运行的程序。
范式怎么落地
说回现实。大多数企业不可能像曾国藩那样推倒重建。编制思维可以渐进式落地,不需要一个governance framework,从四个具体动作开始就够了。但这四个动作有顺序,顺序本身就是方法论。
第一步,定Owner,定问题。 先别急着建governance committee。我见过企业技术部门搭了治理委员会,流程画得很漂亮,但上面依然回答不了一个最基本的问题:"这个agent为什么存在?"委员会管的是流程,但agent的起点问题不是流程能回答的,得业务负责人自己想清楚。所以真正的起点不是"先数你有多少个agent",而是"先问为什么要有这个agent"。每一个agent的存在理由,都要能回溯到一个具体的业务问题和一个具体的负责人。Owner不是IT,是业务方。就像曾国藩的营官自选兵勇,谁部署的agent谁负责。Owner对agent的权限范围、数据边界、成本预算、产出质量负全责。这一条落地了,一半的治理问题大概率会自然消解。
第二步,清点存量。 如果你的企业已经跑了一堆agent,做一次盘点。你的企业现在有多少个agent在运行?如果答案是"不知道",这就是值得优先做的事。行业数据显示,只有18%的企业有完整的agent资产清册。没有清册,后面所有动作都是在盲区里操作。
第三步,裁冗。 砍掉没有Owner和明确问题定义的"浊军"。判断标准可以参考曾国藩的逻辑:跑了超过三个月、没有人review过输出、没有明确业务目标的agent,大概率就是你的浊军。不妨做一次"agent断舍离",停掉它们一周,看谁来问。没人问,就是没人用。真正创造价值的agent停一天就有人叫,这是最诚实的检验。
S&P Global数据显示,42%的公司在2025年砍掉了大部分AI项目。IDC的统计更直接:88%的AI agent试点项目永远到不了生产环境。那些半死不活的试点agent,占着API额度、消耗着算力、保留着数据权限,却没有人为它们的存在负责。及时止损不丢人,拖着僵尸agent积累安全债才是真正的浪费。
第四步,设限。 Teleport 2026年的研究给出了一个数字:权限过度开放的AI系统,安全事故率是最小权限系统的4.5倍。一个agent只需要拥有完成其任务所需的最低权限,就像湘军哨官只管自己的八队,不能越过营官调动其他哨的兵力。
Microsoft 365 Copilot的零点击漏洞值得所有管理者了解。2025年6月披露的CVE-2025-32711,CVSS评分9.3。攻击者只需发一封暗藏指令的邮件,Copilot在做例行邮件摘要时就会自动执行嵌入的恶意操作,因为它有权限访问OneDrive、SharePoint和Teams的全部内容。没有人点击了什么,没有人犯了什么错误,漏洞完全来自权限给得太大。防线不在你手里了。
未来的判断
曾国藩裁撤湘军时写过一段话,大意是:湘军锐气已泄,好的兵将陆续散去,留下来的骄纵不服管束,中间还掺杂了游勇奸民。把这段话里的"湘军"换成"AI agent","游勇奸民"换成"僵尸agent和shadow AI",对2026年的大多数企业完全适用。
兵贵精不贵多。Agent也一样。
在我的判断中,未来两年AI agent领域最大的分水岭不在模型性能,不在应用场景,而在于谁先把管人的隐性默契转换成了管agent的显性范式。管人靠默契,管agent靠范式。大多数企业还没有开始这个转换。
如果你也在思考企业AI agent的治理问题,可以关注公众号「顾青谈增长」,我会持续分享这个领域的判断和实践。
延伸阅读:
科学决策具体实践参考:
夜雨聆风