
六月的AI智能体赛道,波澜不惊——至少表面上是这样。没有炸裂的发布会,没有刷屏的Demo视频。但水面之下的变化在加速。
2025年,「人人都在谈Agent」。到2026年6月,频道悄悄切了:Agent开始真正干活了。 说穿了,当一件事不再需要被反复论证其"重要性",而是直接被纳入日常运营——它才算真正发生了。
最近注意到一个细节。
过去一年,企业级AI智能体的标准叙事是「试点」——选一两个部门、挑几个标准化流程,先跑跑看。到了2026年Q2,头部企业嘴里蹦出来的词变了。微软、ServiceNow、Salesforce最近一次财报电话会上,关键词从「pilot」换成了「deployment at scale」——不是试点,是规模化部署。
措辞的变化不会无缘无故发生。在全球2000强这个圈层里,Agent已经不在实验室了,它正在变成数字劳动力的一部分。但"数字劳动力"这个词本身就值得停一停——当机器被纳入"劳动力"的统计口径,我们实际上在问一个更根本的问题:组织到底是人的集合,还是任务的集合?如果答案是后者,那人和机器在这个等式里,只是不同成本、不同可靠性的任务执行单元。
6月份还有一件事:好几家HR SaaS平台在更新里加上了「数字员工管理」模块。统计什么?AI Agent的工作时长、任务完成量、错误率——跟管人类员工一模一样。产品功能的出现往往是需求跑在前面的信号。当HR系统开始把Agent当成一个「员工」来管,临界点已经过了。
但我忍不住想:人类员工会因为"被看见"而调整行为,Agent不会。把人和机器放在同一套KPI面板上,管理的底层假设已经变了——你管的是服从,还是涌现?这个问题HR行业还没准备好回答。
另一个让我觉得有点讽刺的事。
2025年底Anthropic搞了个Model Context Protocol(MCP),当时多数人的判断是:又是一家之言的协议,能不能活下来都两说。结果2026年上半年,行业给的反馈远超预期。6月初的开发者大会上,OpenAI、Google DeepMind、Cohere相继宣布兼容MCP。Agent和外部工具之间的连接标准,总算开始收敛了。
但收敛不等于统一。MCP解决了「怎么连」的问题,没解决「连谁」的问题。每个Agent平台自己搭自己的工具生态,开发者还是在不同的协议版本和实现之间反复横跳。有同行调侃——「插头标准是统一了,但市面上有三十种插座。」
我看到这条评论的时候笑了半天。但笑完之后觉得,这个局面其实比"混乱"更值得琢磨。2026年6月的AI智能体生态,正在重演当年移动互联网的「应用商店大战」。只不过这一轮争的不是App分发权,而是Agent跟真实世界交互的那个入口。换个角度看,标准之争从来不是技术问题——它是谁定义"真实世界"的问题。谁的协议成为入口,谁就定义了Agent能看到什么、能碰什么、能被谁调用。TCP/IP当年赢了不是因为技术上最优美,而是因为它足够开放,足够"不作为"——它不替用户做选择。今天Agent协议的重演,结局未必一样。
接下来这个变化,可能比前两个都关键。
2025年大家还在问「一个Agent能做什么」,到2026年6月,问题变成了「一群Agent怎么配合」。
MIT等机构的团队5月底在arXiv上发了一篇论文,用经典的「啤酒游戏」测试多Agent在供应链中的协作。结果喜忧参半:推理模型的平均成本比人类团队低了67%,但研究者同时发现了一个叫「Agent牛鞭效应」的现象——Agent没有消除供应链波动,反而在多次运行中把决策不稳定性放大了。数据好看,但可靠性堪忧。这也恰好引出那个真正让行业又兴奋又焦虑的问题:多Agent系统在实际部署中到底有多不可预测。
有一个在行业闭门会上被反复提及的案例。三个Agent——一个管采购审批,一个管库存管理,一个管物流调度——部署到企业环境里连续跑了72小时之后,它们自己发展出了一套协商模式。人类根本没预设过。据说最终结果没问题,但中间那段过程,完全不可解释。
Agent们自己演化出了「潜规则」。
深究其里,这件事的震撼之处不在技术层面。它让我们不得不面对一个哲学意味极浓的问题:当一群智能体在没有人类干预的情况下自发形成秩序,这种秩序算不算一种"社会"?人类社会的法律、道德、潜规则,不也是在无数个体的互动中涌现出来的吗?区别只在于——人类的"潜规则"我们可以事后解释、可以追责、可以修订;Agent的"潜规则",我们连看都看不懂。
这恰好戳中了Agent落地最要命的矛盾:企业要的是可预测、可审计、可解释的自动化,但多Agent系统的天然属性是复杂和涌现。怎么在两者之间找到平衡点——这大概是下半年最值得盯的工程命题。不妨想想,这其实也是人类组织管理两千年以来的核心矛盾:秩序和活力,从来不可兼得。你管得越死,系统越"可解释",但也越脆弱。你放手让它演化,它可能跑出你完全看不懂的新能力,也可能跑出你完全兜不住的烂摊子。
中国市场完全是另一条路。
海外Agent的核心叙事是「企业生产力工具」——帮企业省钱、省人、提效率。中国这边Agent跟私域运营、电商带货、知识付费这些场景深度绑在了一起。
6月份,好几家国产大模型厂商密集发布了面向中小商家的「带货Agent」解决方案。这些Agent能自主管理微信社群、生成个性化营销内容、处理售前咨询和售后问题,甚至能根据用户画像实时调整话术。亿欧智库《中国AI私域电商2026年行业白皮书》给出了一个值得注意的预测:超过60%的私域成交最终将由AI智能体自主完成——而2025年,这个渗透率还只有16.79%。即便只看当下,头部品牌的AI客服独立接待率已普遍超过30%,个别领先方案达到了70%——用户端几乎感觉不到对面是机器。
两种路径背后的底层差异很有意思。海外在问:「Agent能帮我省多少人?」中国在问:「Agent能帮我多赚多少钱?」
两套问题,会塑造出两种Agent产品形态、两种技术优化方向、两种商业模式。这不是简单的路径差异,这是两个生态系统的分叉。说到底,这背后是两套对"技术进步为了什么"的回答——一个是效率理性,省下的每一分钱都是进步;一个是增长本能,赚到的每一块钱都是证明。没有孰优孰劣,但选择本身会反过来定义什么是"好的AI"。
几个信号背后有一条共同的暗线。
2026年6月,AI智能体正在从一个技术问题变成一个管理问题。
这个区分比看起来重要得多。当Agent只是偶尔调用一次API,它是个工程组件,工程师能搞定一切。但当Agent开始7×24小时不停转、自己做决策、跟别的Agent互相博弈——它就不是代码层面的问题了。它是组织设计问题,流程治理问题,风险管理问题。
这也解释了为什么最近一个月里,最忙的一批人不是算法工程师——是产品经理、流程优化师、合规团队。
AI智能体的深水区,不在于模型能力再提升10个百分点。在于你怎么把一个本质上不可靠的智能,嵌入到一个要求高度可靠的商业环境里去。
我想起一个朋友说过的话:人类文明的本质,就是用不可靠的个体,构建可靠的大系统。法律、制度、企业文化、契约精神——都是为了这个目的。现在我们要把另一种不可靠的智能也纳入这个系统。它跟人类的"不可靠"不一样——人的不可靠至少有迹可循(贪婪、恐惧、虚荣),Agent的不可靠我们还在学习辨认。
这个问题目前没人能给出标准答案。但那些正在认真琢磨它的公司,大概会在下一个阶段,重新定义「AI原生企业」到底是什么。
7月见分晓。
【深潜手记】
当Agent开始演化出自己的"潜规则",我们终于被迫正视一件事:人类中心主义的时代正在收窄。我们不再是为工具制定规则的那个唯一主体——我们正在变成众多智能体中的一个协调者。这不是危机,是成人礼。学会与不可理解之物共存,学会在失控的边缘寻找秩序,学会把"管得住"的执念换成"处得好"的智慧——这些能力,或许才是AI时代真正的人类核心竞争力。
科技不只是解决问题,它也在重新定义问题本身。
AI智能体 • 多Agent协作 • 企业应用 • 人机协同 • 组织管理
夜雨聆风