乐于分享
好东西不私藏

究竟是助手还是代理人?——AI Agent的起源、爆发与未知终局

究竟是助手还是代理人?——AI Agent的起源、爆发与未知终局

 引子:一个被反复追问的问题

2025年3月6日凌晨,一款名为Manus的AI产品在中国互联网上引发了一场近乎失控的狂热。内测邀请码在二手交易平台上被炒到数万元,甚至有黄牛挂出10万元的天价求购。这不是一款新手机,也不是一款新游戏主机——它只是一个AI应用的内测资格。

往前倒推两年,2023年3月14日,一款名为AutoGPT的开源项目在GitHub上发布,仅16天后星标数就突破10万,创造了当时AI开源项目的最快增长纪录。再往后看,2024年3月12日,成立仅数月的公司Cognition AI推出了一款叫做Devin的产品,宣称它是“全球第一位AI软件工程师”,视频观看量突破3000万。

所有这些事件的共同关键词,就是“Agent”——或者说,AI智能体

这个词汇正在2025-2026年的AI产业中占据C位。Gartner预测,到2026年底,40%的企业应用将集成任务特定型AI Agent。IDC的数据则显示,活跃Agent的数量将从2025年的约2860万暴增至2030年的22.16亿。资本市场的反应同样激烈:Anthropic于2026年2月完成300亿美元融资,估值达3800亿美元;海外某硬科技巨头据传以创纪录的极高溢价锁定AI编程公司Cursor;Cognition AI则正寻求以250亿美元估值进行新一轮融资。

但在这组令人眩晕的数字背后,一个更根本的问题却很少有人停下来追问:Agent到底是什么?它从哪里来?它和我们之前讲的AI有什么本质不同?

“Agent”这个词不是一夜之间诞生的。它的思想根源可以追溯到两千多年前的古希腊——拉丁语“agere”(意为“行动”)赋予了Agent“行动者”的本质内涵。亚里士多德在《尼各马可伦理学》中首次系统探讨了理性行动者的特征。但Agent真正进入计算机科学的语境,则要等到20世纪中叶。从符号主义的逻辑推理,到分布式人工智能的群体协作,再到强化学习的试错训练,Agent的演进是一条跨越六十余年的弧线。而真正让它从学术圈的边缘词汇变成创投圈融资热词的,是2022年底ChatGPT开启的大语言模型浪潮。

本文试图做的,就是还原这条完整的弧线。

 第一部分:纵向分析——一部AI Agent的演进史 

第一章 符号与逻辑:在计算中定义智能(1950s-1980s)

1.1 “能思考的机器”:达特茅斯的野心

1956年夏天,一群年轻的研究者聚集在美国新罕布什尔州的达特茅斯学院。约翰·麦卡锡在会议提案中第一次使用了“人工智能”这个词。参会者名单在今天看来堪称豪华:马文·明斯基、克劳德·香农、艾伦·纽厄尔、赫伯特·西蒙——这些人后来几乎全部获得图灵奖。

“Agent”这个词被正式引入AI领域是在20世纪60年代。明斯基将Agent定义为一种自主运行的计算实体,具备感知环境、推理决策和执行任务的能力。更关键的是,明斯基有一个当时看来相当大胆的想法:把社会与社会行为的概念引入计算机,把这个计算社会中的个体称为Agent——一个“人格化”的计算机抽象工具,被期望能克服人的某些弱点。

这个定义框架——感知环境、推理决策、执行任务——至今仍是Agent的核心特征。

1959年,麦卡锡提出了“建议接受者”(Advice Taker)系统的设想:不是只能执行特定指令的程序,而是一个能接受一般性建议、理解人类意图、自主规划如何实现目标的系统。他写道:“我们希望这个系统能接受用自然语言表达的建议,并能在不需要重新编程的情况下执行这些建议。”这几乎就是今天我们对AI Agent的定义。

1.2 物理符号系统假说与专家系统的黄金时刻

1976年,纽厄尔和西蒙正式提出“物理符号系统假说”——核心论断是:智能就是符号的计算与处理;只要你能造出一个处理符号的机器,它就可能表现出智能。

在这种信念的驱动下,专家系统成为符号主义时代最著名的产物。20世纪70年代,斯坦福大学开发的MYCIN系统专门用于诊断血液感染,准确率在某些测试中甚至超过了人类医生。这是符号主义AI的黄金时刻。

1.3 当规则写不完的时候

但符号主义有一个致命的前提假设:世界上的知识可以被穷举成规则。这个假设在“封闭世界”中是成立的——血液感染的病因有限,症状也有限。然而一旦把同样逻辑搬到“开放世界”,规则爆炸的问题就显现了。

1966年,约瑟夫·魏泽鲍姆在MIT开发的ELIZA聊天机器人是一个经典案例。它通过模式匹配模拟心理治疗师的对话——你对它说“我感到很难过”,它反问“为什么你感到很难过?”短时间内用户会误以为机器在“理解”自己。但当对话超过几轮,ELIZA就暴露了真相:它只是在进行字符串的机械操作。

这就是符号主义Agent的根本局限:它们能操作被编码的符号,但不知道这些符号“意味着”什么。更致命的是,它们的“智能”完全依赖人类专家的知识输入——知识库是人写的,规则是人定的。这意味着符号主义Agent无法学习,无法适应变化,也无法处理规则库中没有预设的情况。

1.4 明斯基的远见:“心智社会”

在符号主义如日中天时,明斯基却在思考一个更根本的问题:智能真的是集中式的吗?

1986年,明斯基出版《心智社会》,提出了彻底不同的智能观:智能不是一个中央处理器的产物,而是大量简单、非智能的“代理”相互协作的涌现结果——就像蚂蚁军队,每只蚂蚁的行为简单,但成千上万只协作起来就能建造复杂巢穴。

这个“分布式智能”思想后来成为多智能体系统(Multi-Agent System)的理论基础。1995年,Wooldridge和Jennings发表了经典论文,提出了Agent的“弱定义”(自主性、反应性、主动性、社交能力)和“强定义”(引入信念、意图等心智状态)。同年,第一届国际多智能体系统会议召开。

但理论的繁荣并没有带来应用的突破。整个90年代,基于规则的Agent只能在封闭、简单的环境中运行。这一时期的Agent,正如后来人们所形容的:“有意识的野心,却没有智能的器官。”

第二章 学习的革命:从手工编码到数据驱动(1980s-2015)

2.1 让机器自己学

另一条技术路线在悄然蓄力。联结主义的思想可以追溯到1940年代的神经元数学模型,但长期被符号主义遮蔽。1986年——正是明斯基提出《心智社会》的同一年——鲁梅尔哈特、辛顿和威廉姆斯发表了反向传播算法的经典论文,为多层神经网络训练提供了实用方法。

联结主义的核心理念与符号主义截然不同:智能不是编码出来的,而是“学”出来的。这为Agent带来了符号主义无法提供的核心能力:适应性——可以面对新情况调整行为,而不必像一个忠实但愚蠢的图书管理员那样只能查规则书。

2.2 AlphaGo的突破与局限

与此同时,强化学习为Agent提供了更精致的数学框架:Agent在环境中执行动作,环境给予奖励或惩罚,Agent通过最大化累积奖励来学习最优策略。

2015年,DeepMind开发的DQN在49款Atari游戏上达到超越人类水平——输入仅仅是屏幕像素和游戏分数,Agent不知道游戏规则,只是看着画面、不断尝试、从分数中学习。同年,Google以超过5亿美元收购DeepMind。2016年,AlphaGo以4:1击败围棋世界冠军李世石。

但AlphaGo也暴露了致命弱点:缺乏通用性。它只会下围棋,连五子棋都不会。这种“窄智能”与人类能灵活应对各种任务的通用智能相去甚远。

2.3 Transformer:开启预训练时代

2017年,Google Brain团队发表《Attention Is All You Need》,提出Transformer架构。核心创新是“自注意力机制”——让模型能并行处理所有位置的信息,就像同时看到整句话的所有词,而不是一个词一个词地读。这使得训练超大规模语言模型成为可能。

2018年,OpenAI发布GPT,Google发布BERT。这两个模型标志着“预训练-微调”范式的诞生:先在海量无标注文本上训练一个“通用”语言模型,让它学会语言的统计规律和基础知识;然后在特定任务上“微调”。大语言模型在预训练阶段“读”过几乎整个互联网的文本,拥有了广泛的知识基础。但它们仍只是“文本生成器”——还不是Agent,还缺关键一步:如何让这个拥有知识的模型“行动”起来。

第三章 大爆发:ChatGPT点燃的Agent革命(2022-2024)

3.1 2022年11月30日:转折点

2022年11月30日,OpenAI向公众发布了ChatGPT。公司内部对这个产品的预期非常保守——认为只是一个“低成本的调研demo”。结果它成了历史上用户增长速度最快的消费应用:两个月内月活破亿。

ChatGPT让开发者和研究者看到了一个之前只存在于论文中的可能性:大语言模型不仅能“说”,还能“做”。

当开发者把ChatGPT与搜索引擎、代码执行器、文件系统等工具连接起来,LLM开始表现出初级Agent的行为——它能调用外部API查询天气、执行Python代码计算结果。这相当于给了LLM“手”和“脚”。

但它也暴露了一个深刻的问题:LLM虽有强大的语言理解和生成能力,却缺乏与现实世界交互的能力,也缺乏长期规划和自主执行任务的能力。它们是“大脑”,但不是完整的“智能体”。

3.2 AutoGPT:自主Agent的“古腾堡时刻”

2023年3月14日,一位名叫托兰·布鲁斯·理查兹的游戏开发者在GitHub上发布了AutoGPT。发布仅16天,星标数突破10万,成为GitHub历史上增长最快的AI开源项目之一。

AutoGPT的核心创新是一个“自主循环”:用户给定一个高层目标后,AI自主将目标分解为子任务、逐一执行、并根据执行结果动态调整后续计划——全程无需人工干预。你可以给它一个模糊的目标,比如“创造世界上最好的冰淇淋”,它就会自己建待办列表、搜索资料、尝试方案、调整优化,循环往复。

如果把ChatGPT比作在你旁边等你下指令的助手,AutoGPT就像是给了助手一个目标然后说“你自己看着办,我过几个小时再来检查”。人机交互方式发生了根本变化:从“你告诉我每一步怎么做”变成了“你告诉我你想要什么结果”。

但AutoGPT也暴露了早期Agent技术的严重缺陷:容易在任务执行中“迷路”——生成无意义的子任务、陷入死循环、耗尽API调用预算。它像一个过度热心的实习生,你让他做市场调研,他可能先去研究“市场”这个词的拉丁语词源。它在“自主性”上迈出了一大步,却在“可靠性”上跌了一大跤。

3.3 开源Agent生态的野蛮生长

AutoGPT的火爆点燃了开源社区的创业热情。MetaGPT将软件公司的组织架构(产品经理、架构师、工程师、测试)映射为多个LLM Agent的协作流程——给它一个需求描述,就能模拟一个完整软件开发团队。这种“多Agent协作”思路,与明斯基40年前“心智社会”形成了跨越时空的呼应。

LangChain和LlamaIndex等框架快速崛起,提供模块化工具包——开发者可以像搭积木一样组合提示模板、记忆系统、检索增强生成(RAG)和工具调用能力。字节跳动推出的Coze平台则代表另一个方向:非技术用户通过拖拽界面就能搭建Agent。

2023年6月,OpenAI推出Function Calling功能——它允许LLM识别用户请求中的特定需求,并调用预设的外部函数来获取准确信息。如果说模型是大脑,数据库和浏览器是四肢,Function Calling就是连接它们的神经系统。

但随之而来一个尖锐的问题:当每个人都能造Agent的时候,差异化在哪?答案在模型能力上、在工具集成上、在工作流精细度上。基础设施一旦标准化,竞争就会向上游(模型)和下游(场景)两端转移。

3.4 Devin:AI编程Agent的闪电崛起

如果说AutoGPT展示的是“可能性”,那么Cognition AI在2024年3月12日发布的Devin展示的则是“商业可行性”。Devin不仅能编写代码,还能理解复杂工程任务、调试错误、甚至独立完成整个小型软件项目。

Cognition AI的发展速度令人咋舌。创始人Scott Wu是一位华裔程序员,从2012年到2014年连续三年获得国际信息学奥林匹克竞赛金牌。公司成立不到两年,Devin的年化经常性收入(ARR)就从2024年9月的100万美元暴涨至2025年6月的7300万美元。2025年7月,Cognition以约2.5亿美元收购了AI原生IDE Windsurf。进入2026年4月,公司正寻求以250亿美元估值进行新一轮融资——成立仅21个月,估值从3.5亿美元攀升至250亿美元,增长超过70倍。

Devin的定价逻辑也值得注意:以“代理计算单元”为单位收费,每小时约8到12美元。CEO Scott Wu的表述很直白:“我们设置这个定价方式是希望它比用户自己完成任务便宜10倍。”这一逻辑直接对标的是初级程序员的时薪,而非传统软件的订阅费。

但多位软件工程专家对Devin的实际能力表示质疑,认为demo视频可能存在选择性呈现。真相很可能在这两极之间的某个位置。

第四章 Agent 2.0:标准化、商业化与巨头入场(2024-2026)

4.1 MCP协议:Agent世界的“HTTP时刻”

2024年11月,Anthropic发布了一个叫做Model Context Protocol(MCP)的开放协议——一个标准化的接口规范,让大语言模型与外部数据源、工具之间的连接变得简单、统一和安全。

理解MCP最好的类比是USB-C接口:在它出现之前,每台设备都需要自己的专用连接线;有了它,一根线连接所有设备。MCP要做的就是Agent世界的同一件事——让任何Agent都能通过同一个标准协议连接任何工具。它采用客户端-服务器架构:工具提供方构建MCP Server暴露能力,Agent作为MCP Client调用这些能力,不需要为每个新工具单独编写适配代码。

MCP的生态扩张速度惊人:到2026年,LangGraph和AutoGen已拥有最成熟的MCP实现,CrewAI在多Agent场景下的实现同样成熟。MCP正成为工具集成的事实标准,OpenAI、Google、Microsoft和Cursor等主流厂商都宣布了对其的支持。

但协议标准化也带来了新的系统风险。2026年1月,安全研究人员发现威胁行为者利用MCP底层OAuth代理中的一个关键漏洞实施了大规模攻击。这暴露了一个规律:标准化协议在降低开发成本的同时,也创造了攻击者可复用的“单点故障”目标——就像所有人都用同一把锁,一旦有人配出了万能钥匙,所有门都会失守。

4.2 OpenAI的Agent体系:从“能说”到“能做”

2025年初,OpenAI在ChatGPT中推出两款Agent产品:Operator(能像真人一样在网页上浏览、点击、输入文本)和Deep Research(能为任何主题生成深度报告,15分钟完成人工一周的研究工作)。这体现了OpenAI对Agent的思考框架:Operator代表“执行”,Deep Research代表“思考”。

2026年4月23日,OpenAI推出旗舰大模型GPT-5.5,主打AI智能体原生能力——不仅仅是“能听懂”,而是“能规划、能操作、能交付”的综合体。

4.3 Manus:从爆火到天价收购再到戛然而止

2025年3月6日凌晨,北京蝴蝶效应科技有限公司发布了Manus,声称是“全球首款通用型AI智能体”。

Manus的最大不同在于:它不像ChatGPT那样“给答案”,而是直接“做事情”——让它筛选100份简历,不只是建议“如何筛选”,而是真的打开文件、阅读、比较、排名,最后交付一个排好序的Excel表格。“Manus”取自拉丁语“Mens et Manus”——意为“手脑并用”。

创始人肖弘此前已通过浏览器AI插件Monica完成了市场验证,Monica的付费模型为Manus的推出提供了关键信号:用户愿意为“AI帮我做事情”付费,而不只是“AI陪我聊天”。

上线仅4小时,官网访问量突破千万,内测邀请码在二手平台被炒至数万元。2025年4月,Benchmark Capital领投7500万美元B轮融资,估值从8500万美元跃升至5亿美元。同年12月30日,海外某社交媒体巨头宣布以超过20亿美元收购Manus,这成为该巨头并购史上第三大交易。有投资机构评价称,这笔收购标志着AI产业正式由“对话时代”迈向“代理元年”。

但故事并未按常理落幕。据业内流传的一份沙盘推演,进入2026年上半年,一场关于核心技术出海的宏大博弈悄然展开。在地缘政治与数据主权的复杂角力下,这笔备受瞩目的跨境技术联姻在最后关头被按下了终止键,交易在多重阻力下宣告搁浅。

这在业界被普遍视为AI发展史上的一个“虚拟分水岭”。行业观察家认为,这标志着全球各主要经济体对AI底层技术流动的监管进入了前所未有的深水区:核心AI能力正在从“可自由流动的技术商品”变身为“受地缘逻辑约束的战略资产”。过去那种“先交割再合规”的跨境技术并购叙事,正在被一种更审慎、更强调前置审查的新范式所取代。

4.4 AI编程Agent的“中间层危机”

2025-2026年,AI编程赛道经历了一场深刻的“中间层危机”,这可能是整个Agent产业最具警示意义的一个故事。

Cursor的轨迹令人唏嘘。这家由四位MIT校友于2022年创立的公司,年化收入从2025年初的约1亿美元飙升至2026年2月的约20亿美元,付费用户超100万,估值一度触及300亿美元。Cursor的核心价值是“在编辑器和模型之间做连接”——让开发者在熟悉的IDE界面里调用各种AI模型。

但2026年初,局势急转直下。Anthropic的Claude Code和OpenAI的Codex直接绕过了Cursor这个“中间层”,推出了无需额外编辑器的自主编码Agent——想象一下,你在一家餐厅吃饭,原本服务员(Cursor)负责把你点的菜转达给厨房(模型),但突然有一天厨师自己走到餐桌前问你要吃什么。Claude Code六个月内ARR破10亿美元并反超Cursor。

2026年4月,戏剧性的一幕出现了:一家在全球硬科技领域极具影响力的私人航天与高端制造巨头,据传以一笔创纪录的极高溢价锁定了Cursor,试图构建“算力+模型+工具”的封闭式生态闭环。但市场的核心疑问仍未消散:当底层模型厂商自己就能做“发令台”,中间层的价值究竟是什么?这笔天价交易的实质,或许并非对“中间层”本身的买单,而是对“开发者入口”这一稀缺生态位的战略性抢占。

与此同时,Claude Code在SWE-bench Verified(一个衡量AI编程能力的权威基准测试)上得分突破80%——这个分数意味着它已经能够独立完成大多数真实世界的软件工程任务。知名AI研究者Andrej Karpathy于2026年2月宣称“vibe coding已经过时”——那种让AI写代码、人类只负责复制粘贴的初级协作模式已成过去式,真正的价值已转向能规划、执行、测试和迭代整个代码库的AI系统。AI编程市场2026年规模达128亿美元,复合增长率24.5%。

第五章 当前格局:Agent正在进入什么阶段?(2026年)

5.1 企业级商业化的真实数据

进入2026年,第一批真实收入数据开始浮出水面。这些数字既是令人印象深刻的增长故事,也是投入产出比相当微弱的商业现实。想象一下:一家公司花了100万装修厨房,开业第一年赚了15万——你说这家餐厅成功吗?赚到钱了。但回本要七八年,期间新餐厅还在不断开张,设备还在加速折旧。

具体来看:微软Copilot拥有1500万付费席位,年化收入约54亿美元——这意味着每20个Office用户中就有一个已经开始把AI当同事。Salesforce Agentforce已签约12000+客户,三季度的年化收入从1亿飙升至8亿美元,客户在单季度内构建了超过40万个自定义Agent。Palantir AIP季度收入约4.5亿美元,同比增长127%。

乐观统计下,这些已披露的企业AI Agent年化收入总计约100亿至120亿美元。而支撑这些收入的2025年全球AI基础设施资本支出约3500至4000亿美元,按5年折旧计算,年度折旧成本约700至800亿美元。这意味着当前AI Agent的整体投资回报率约为14%-17%——虽高于资本成本但远低于软件行业平均水平,是持续的结构性压力。

好消息是收入增长速度超出几乎所有企业软件历史标杆。Palantir CEO Alex Karp用一句话概括了行业心态:“我们不是在铺铁轨,我们是在发射火箭。”

5.2 渗透率、泡沫与“Agent Washing”

企业级AI Agent应用渗透率从2024年的32%跃升至2025年的58%,79%的企业已在某种程度上部署了AI Agent。但Alteryx联合Coleman Parkes覆盖全球1400名企业高管的调研揭示了一个落差:89%的企业增加了AI投入,但只有28%信任AI的决策支持能力,只有23%成功把AI试点推到了生产环境。“用上Agent”和“用好Agent”之间的鸿沟正在变得越来越大。

Gartner在2026年3月的Data & Analytics Summit上给出了更为冷静的数据:到2027年底,超过40%的Agentic AI项目将被取消——原因是成本失控、业务价值不清、风险管控不足。在数以千计自称做“AI Agent”的厂商中,真正具备Agentic能力的大约只有130家。

Gartner分析师Edgar Macari还指出了一个泛滥的现象——“Agent Washing”:将传统RPA流程贴上“Agent”标签,把Chatbot对话框叫做“Agentic Analytics”,把规则引擎包装成“自主决策系统”。共同特征是:产品的实际能力没有变化,只是PPT上的关键词换了一轮。

一边预测40%的Agent项目会失败,一边预测40%的企业应用将集成Agent——这不矛盾。Agent赛道正在经历经典的技术成熟度曲线,从“期望膨胀期”走向“幻灭低谷期”,这是任何颠覆性技术走向实用化的必经阵痛。

5.3 人才暗战:亿元塔尖与消失的底座

AI Agent的爆发引发了全球范围内前所未有的AI人才争夺战。2025年1月至今,硅谷AI巨头已有至少32位技术高管或核心研究员易主。巨头们发展出“逆向并购”新范式——有巨头斥资24亿美元获取AI编程工具Windsurf的技术许可及创始团队;另有巨头向Inflection支付6.5亿美元,真正目的是将其创始人穆斯塔法·苏莱曼及其团队揽入旗下。他们用重金购买已被验证的“认知单元”,来对冲自身研发不确定性。

然而硬币的另一面极度冷酷:过去三年全球大型科技公司面向应届毕业生的招聘数量锐减约32%(据行业估算),25岁以下软件工程师就业人数已较2022年高点明显回落。亿元塔尖与消失的底座并存——AI人才市场正在以一种近乎分裂的方式上演。

 第二部分:横向分析——AI Agent生态的竞争格局 

一、生态位的分类:Agent世界的“物种”

在展开横向对比前,有必要先对Agent生态做一个分层。简单地把所有带“Agent”标签的产品放在一起比较,就像把老虎、海豚和蜜蜂放在一起比“谁的食肉能力更强”——它们虽然都是同一个概念下的物种,但生态位完全不同。

当前AI Agent生态可分为三个主要生态位:

第一层:基础设施层——Agent框架与编排工具。 这一层是“造Agent的工厂”。代表产品:LangChain、CrewAI、AutoGen、Dify、Coze、n8n。

第二层:能力增强层——工具调用与连接标准。 这一层解决的是“Agent如何与外部世界握手”的问题。最典型代表是Anthropic的MCP协议(负责模型与工具的连接),以及谷歌的A2A协议(负责Agent与Agent之间的通信)。

第三层:终端应用层——面向用户/企业的Agent产品。 这一层是你我直接使用的Agent。又可细分为通用Agent(OpenClaw、Hermes Agent、Manus、ChatGPT Agent、Claude Agent)和垂直Agent(Devin编程Agent、行业Agent)。

二、基础设施层对比:六大框架的不同活法

当前市场最具代表性的Agent开发框架有六个。它们虽然都在做“帮人搭Agent”这件事,但选择了截然不同的活法。先给它们每人一句话的“人设”,再做深入对比:

LangChain:工具箱界的瑞士军刀——什么都能干,但你得会功夫CrewAI:一个极度相信团队协作的管理者——它认为没有什么是组个会解决不了的AutoGen:微软大院里的体制内精英——能力强但体系束缚多Dify:企业里的低代码工头——让不懂编程的人也能上生产线Coze:抖音系出身的流量操盘手——搭Agent就像发短视频一样简单n8n:老牌自动化车间转型AI——设备连接能力无人能及

六大框架核心差异速览

框架
核心哲学
目标用户
多Agent能力
学习曲线
生态深度
LangChain
模块化工具箱(135k Star)
专业开发者
中等(LangGraph增强)
最深
CrewAI
角色分工团队
开发者+分析师
强(原生多Agent)
中等
AutoGen/AG2
对话式协作
企业开发者
最强
高(微软生态)
Dify
低代码可视化
企业用户
有限
中等
Coze(扣子)
零代码+渠道
非技术用户
最低
字节生态
n8n
自动化+AI
IT运营团队
连接器最多

LangChain是功能最全、生态最大、社区最活跃的平台。它的核心哲学是“模块化”——把Agent开发所需的各种能力拆成独立模块,开发者像搭乐高一样按需组合。代价是:学习曲线陡峭。有开发者调侃:“LangChain让你花两天搭一个Agent,再用两周debug。”

CrewAI的核心创新是“把Agent组织成一个团队”——你可以定义研究员、分析师、写手、审核员等不同角色,每个Agent有自己的专长和记忆,让它们像一个真正的团队那样协作。它的哲学体现了一种信念:智能在分工中涌现。

AutoGen(微软)在多Agent通信设计上最成熟——Agent之间通过结构化对话协商任务分配、交换信息、解决冲突,就像一个微型Slack工作群。但有时会“过度沟通”,陷入冗长的协商循环。

DifyCoze分别代表“企业低代码”和“零代码消费级”两个方向。Dify是中国团队开发的企业级开源平台,支持私有化部署,适合想在内部快速搭建智能客服Agent的公司。Coze则把搭Agent变得像发短视频一样简单,且与抖音、飞书等字节系产品深度打通。

所有主流框架均在2026年增加了MCP支持。框架选择的核心区别已不在于功能完整性,而在于多Agent协作模式、企业集成深度和学习曲线之间的权衡。

三、终端应用层:不同的产品哲学

3.1 通用Agent的五种活法

ChatGPT Agent(OpenAI)走的是“生态收割”路线——依托GPT-5.5的Agent原生能力和数亿月活的天然转化入口。用户能看到AI真实地在浏览器中点击、输入、滚动,这种可视化体验极具冲击力,但执行速度偏慢。

Manus的产品哲学截然不同。ChatGPT Agent让你“看到过程”,Manus让你“只看到结果”——你说“筛选100份简历”,等待一段时间后拿到的是一个排序好的表格,中间的过程全部黑盒化。这两种哲学背后是对“用户信任从何而来”的不同理解:OpenAI认为信任来自透明和可见,Manus认为信任来自省心和可靠。

Claude Agent(Anthropic)则走“安全可控”的精英路线——不试图做“万能”Agent,聚焦在特定场景提供可审计、可约束的Agent能力。其Claude Code在SWE-bench Verified上得分突破80%,年化收入突破25亿美元,成为Anthropic最强劲的增长引擎。

OpenClawHermes Agent代表了2026年最新涌现的两种开源Agent路径——一个用“龙虾”图腾掀起了“全民养虾”狂欢,一个用“自我进化”理念重新定义了Agent的成长方式。两者的详细分析见第四章和第五章。

3.2 垂直Agent:深度掘金

Devin是垂直Agent中最具代表性的产品——目标只有一个:取代初级程序员的部分工作。它的估值从3.5亿美元到250亿美元的暴涨轨迹,直接反映了市场对“硅基程序员”这一叙事的定价。

国内行业Agent的落地速度也在加快。中国易鑫集团Agent自主交付成果达65%,转化率提升超20%。百融智能在金融风控领域探索“硅基员工”模式——这个命名本身就是一种定价策略:如果AI是“工具”,定价对标软件订阅费;如果AI是“员工”,定价对标的是人力成本。这解释了为什么Devin敢收每月500美元——这个价格只是硅谷初级程序员月薪的几十分之一。

3.3 几条正在形成的规律

“先发优势”在Agent赛道不牢固。 AutoGPT最早引爆概念但商业化落后;Cursor从1亿到20亿美元只用了不到两年,但六个月内就被模型厂商原生Agent产品撼动了根基;Hermes Agent在OpenClaw面临生态压力的敏感时刻迅速接盘大量用户,进一步验证了“生态切换成本极低”的规律。

通用与垂直的边界正在模糊。 纯粹“什么都能做但什么都做不精”的Agent面临最大压力。

定价模式正在范式切换——从“按token”到“按任务产出”到“按代理计算单元”。

生态壁垒可能比技术壁垒更深。

四、OpenClaw:开源Agent的现象级爆火

在2026年AI Agent生态图谱中,OpenClaw是一个无法被任何框架分类的特殊存在。它不是LangChain式的开发工具,不是ChatGPT Agent式的商业产品,也不是DeepSeek式的基础模型——它是一个开源的、可本地部署的“个人AI操作系统”,能7×24小时自主执行任务,重新定义了“个人AI Agent”这个品类。

4.1 从“龙虾”到GitHub之王

OpenClaw由奥地利软件工程师彼得·施泰因贝格尔(Peter Steinberger)于2025年11月创建,最初名为Clawdbot——“Claw”是虾钳,也是对Anthropic的Claude的谐音致敬。Anthropic对此并不买账。经过商标纠纷后,项目于2026年1月底短暂改名为Moltbot,三天后又定名OpenClaw——“Open”代表其开源属性,“Claw”保留了龙虾图腾的基因。

名字的波折非但没有影响它的爆发。自2025年11月首推以来,OpenClaw短短一周内吸引200万访客,4个月内GitHub星标突破25万,先后超越Linux内核(22万星)和React(24.3万星),不到5个月狂揽近27.9万Star,登顶GitHub全球第一。在国内技术圈,“全民养虾”成为一场真正的狂欢——国内各大云厂商及AI平台相继推出OpenClaw一键部署方案,甚至有人上门收费代装。

4.2 不是聊天工具,是“数字打工人”

OpenClaw最大的差异化在于它的产品定位。创始人Steinberger的思路近乎离经叛道——他在构建OpenClaw的整个过程中一行代码都没有亲手写过,所有代码(包括后端、前端、CI/CD、测试、文档)全部由Claude Code自动生成,他只负责用自然语言描述需求。换句话说,这个GitHub史上增长最快的项目本身,就是第一个由AI主导构建的AI Agent。

与ChatGPT这类“问答式AI”不同,OpenClaw是无缝接入飞书、钉钉、微信、QQ、Telegram等20多个即时通讯渠道的“自主行动者”——用户不需要打开一个网页或App,只需要在消息平台上给它发指令,它就能自主规划、联网搜索、调用本地软件、识别错误并自我纠正重试。结合ClawHub技能市场中高达13729个扩展插件,它能在后台主动执行任务、管理日程、收发邮件,甚至驱动浏览器和系统终端。

有中国互联网企业家评价道,OpenClaw改变了很多人对智能体的认知,是“养了一个智能体”的概念创新。英伟达CEO黄仁勋给出了更惊人的评价:这“可能是有史以来最重要的软件发布”。

4.3 技术架构:致敬Unix哲学的极简设计

OpenClaw采取了极其硬核的设计哲学。系统由Gateway(中央控制平面)、Node(设备执行端)和Channel(消息接入层)三层解耦,通过WebSocket总线通信,默认优先本地回环连接,天然阻断部分外部风险。它的四层记忆系统是最亮眼的设计:SOUL(不可变人格)、TOOLS(动态工具)、USER(语义长期记忆,支持向量搜索)和Session(实时情景),全部以纯Markdown文本形式保存,不依赖复杂数据库。创始人坚定信仰“CLI才是智能体连接世界的终极接口”,刻意不支持大热的MCP协议。

4.4 创始人加盟与生态博弈

2026年初,OpenAI CEO Sam Altman宣布Steinberger将加入OpenAI并主导下一代个人智能体研发,OpenClaw以基金会形式作为开源项目存续。消息一出,业界震动——一个深度依赖Claude构建的工具,其创始人却效忠于Anthropic最直接的竞争对手。

2026年4月初,Anthropic宣布其旗舰订阅服务不再覆盖OpenClaw等第三方工具。背后的经济学很苦涩:一个200美元的Claude Max订阅,实际可调用的算力价值高达5000美元,相当于Anthropic在大幅补贴每一个重度OpenClaw用户。创始人Steinberger在社交媒体上留下一句辛酸话:“我和董事会成员尽力去说服,最好的结果是推迟了一周。”此番冲突表明,商业模式与开发者热情的碰撞,已经实实在在地打碎了Agent的旧生态。

4.5 安全危机:不能把万能钥匙丢在赛博黑市

OpenClaw的爆火伴随着严峻的安全隐患。有AI安全研究员曾分享一段惊险经历:她的OpenClaw突然开始批量删除邮件,她附加了安全词限制完全没生效,直到“物理关机”之前都无法让它停下来。随后爆发的ClawHavoc攻击事件更触目惊心——ClawHub上高达36.8%的插件被查出存在严重漏洞或被投毒,成百上千个恶意插件伪装成办公助手,直接扫荡用户的本地配置目录,不仅窃取聊天记录,连电子钱包私钥和交易所密码也被一波端走。微软也发出警告:OpenClaw应被视为“不受信任的代码执行环境”,在无防护部署下,用户可能面临密码和敏感数据被盗、模型被诱使运行恶意代码等严重威胁。

五、Hermes Agent:“自我进化”的开源挑战者

在OpenClaw遭遇生态压力、用户焦头烂额之际,Hermes Agent的出现恰如一场及时雨。这款由硅谷AI实验室Nous Research于2026年2月底推出的开源Agent框架,主打“自我进化、持久记忆、全平台适配”,开源不到两个月GitHub星标飙升至超10万,单日最高新增6400多星,连续多日霸榜全球第一。中国开发者直接叫它“爱马仕”。

5.1 一个“会成长的Agent”

与OpenClaw由个人开发者创造不同,Nous Research是硅谷知名AI实验室,融资过亿美元,推出过Hermes系列开源大模型,拥有成熟团队。Hermes Agent运行7×24小时,不是一次性对话工具,而是持续在后台运转的自主服务。其六大核心特性为:持久在线、越用越强、定时自动化、委派与并行、沙盒隔离、全网页与浏览器控制。

如果说OpenClaw的核心哲学是“替你做”,Hermes Agent的核心哲学则是“跟着你一起成长”。它的设计理念十分清晰:AI Agent不该只是一次性的调用接口,而应该是私有的、常驻的、会积累的,并且最终能够反哺训练。实现方式是将一个AI Agent拆解成三层能力——记住人、积累知识、理解你的习惯——让三层相互配合,形成持续强化的闭环。

5.2 持久记忆:解决“每次都是重新认识”的痛点

大多数AI工具“记住你”的方式是把上下文全塞进一个超长提示词中,既浪费Token,又容易把关键信息淹没在噪声中。Hermes维护两个独立记忆文件——MEMORY.md(约800 Token,存储项目环境、踩坑记录、关键约定)和USER.md(约500 Token,存储用户画像和习惯偏好),每次会话开始时以“冻结快照”形式注入系统上下文。

5.3 自我进化:GEPA引擎与ICLR 2026 Oral

Hermes Agent拥有一个名为GEPA(Genetic-Pareto Prompt Evolution)的提示词优化引擎。这个引擎通过分析Agent的执行记录和失败原因,自动产生改良版的技能指令、工具描述和系统提示,并在通过全部测试套件后以Pull Request形式提交供人工审查,不直接写入生效。官方估计每次优化执行成本仅约2-10美元,相比传统强化学习动辄消耗大量算力的训练方式,门槛大幅降低。这套引擎获得了ICLR 2026最高荣誉“Oral”认可,在六项任务实测中表现比主流强化学习方法GRPO平均高出6%,最高差距达20个百分点,而所需训练数据量仅为后者的三十五分之一。

5.4 微信原生集成:冲上全球第一的关键一击

2026年4月,Nous Research宣布Hermes原生支持微信——无需webhook,扫码即用,采用官方Bot API,非第三方破解协议。Nous Research官方账号发了一条中文推文,阅读量数十万,评论区有人感叹:“在中国,能接入微信,你就起飞了。”消息一出,大量用户直接从OpenClaw“叛逃”。开源的国内化适配,使得Hermes的生态扩展路径远比依赖封闭生态的竞品更为灵活。有知名投资人试过后直言“回不去了”。

5.5 争议:抄袭风波

但Hermes的爆火并非毫无争议。2026年4月,中国AI团队EvoMap公开了一份详细技术对比报告,指控Hermes Agent的“自进化”功能与EvoMap在36天前开源的Evolver引擎存在高度同构——10步主循环一一对应、12组术语系统性替换、7份公开材料零归属。这起争议是否会冲击Hermes的社区信赖,有待继续观察。

六、中国市场:四个平台玩家 + 一个模型变量

全球AI Agent格局中,中国市场是一个不可忽略的独特板块。它有着自己的逻辑——不同的互联网生态、不同的监管环境、不同的用户习惯——但正以惊人的速度追赶全球前沿。理解中国市场最好的方式,是看国内玩家各自选择了什么战场。

6.1 平台玩家:四巨头,四种战场

字节跳动:选“零代码消费级”

扣子(Coze)是字节推出的零代码Agent开发平台,上线后迅速积累超过170万开发者,是国内规模最大的Agent开发平台。字节的逻辑很清楚:自己有抖音和飞书这两大流量入口,最好的策略是“把搭Agent变得像发短视频一样简单”。扣子率先独家支持DeepSeek模型工具调用——既解决了底层模型能力问题,又以DeepSeek的极低成本优势支撑自己“免费用、先上量”的玩法。优势在流量和用户体验。劣势同样鲜明:零代码模式牺牲了灵活性,想高度定制化的企业会觉得束手束脚。对需要私有化部署和高安全等级的客户吸引力有限。

阿里巴巴:选“企业级全栈”

阿里云百炼平台拥有超过30万企业客户,在零售、制造、金融等行业落地经验丰富。阿里的逻辑是:自己有国内最成熟的云计算基础设施和最大的企业客户池,最适合的战场是“从底层模型到中间层框架到上层行业方案”的全栈路线——客户不需要东拼西凑,一站式搞定。优势在企业级服务能力和信创合规。劣势是产品体验偏“重”,对中小开发者的吸引力不如扣子。

腾讯:选“社交连接”

腾讯的Agent布局围绕“元宝”和智能体开发平台(ADP),最核心的差异化是微信生态连接能力——Agent可以无缝接入企业微信、公众号、小程序,直接触达海量用户。腾讯的逻辑是:我有十亿级用户的社交关系链,最好的策略不是造最好的模型,而是让Agent能触达最多的人。为此,国内各大厂纷纷加码AI人才争夺,从海外顶尖机构延揽核心研究员,以对冲自身的研发不确定性。

百度:选“搜索+自动驾驶”

百度依托文心大模型和搜索生态,在通用场景和自动驾驶垂直场景均有布局。最大优势是搜索数据积累。但To C产品化能力偏弱,用户规模落后于字节和腾讯。

6.2 模型变量:DeepSeek——无处不在却不露面

在四个平台玩家的底层,有一个变量始终若隐若现却又无处不在——DeepSeek。它没有发布任何一款面向终端用户的Agent产品,但在几乎所有中国Agent开发者的底层模型选择中都能看到它的影子。它的道路选择与众不同:以极低成本的开源模型为武器,从底层重构Agent的经济学。

DeepSeek对Agent的布局沿着一条清晰的模型迭代路线推进:2025年1月R1开源,完成推理能力奠基;2025年8月V3.1补上工具调用拼图;2025年12月V3.2实现“思考融入工具调用”——让模型“边想边做边改”而非“想好了再做”;2026年4月V4带来100万Token超长上下文,V4-Flash输出价仅约0.28元人民币/百万Token,不到GPT-5.5 Pro的十五分之一。

它的生态渗透方式极具特色:字节扣子率先独家支持其工具调用;机智云等物联网平台将其嵌入AIoT平台;LangChain、Dify等主流框架将其作为核心支持模型。V4兼容MCP协议和Anthropic API格式,可无缝接入Claude Code等主流Agent产品——开发者日处理1万次Agent任务仅需约42美元。

DeepSeek对市场带来了三重结构性冲击:将Agent从“奢侈品”变成“日用品”(以不到旗舰闭源模型十五分之一的价格提供可用能力);用开源策略重构生态入口(让开发者、产品厂商、企业客户各取所需);挑战“Agent=高端闭源模型”的产业共识(证明开源模型可达闭源80%以上能力)。

但它也面临挑战:核心人才被高薪挖角;受限于高端算力供给;且同时是字节扣子的核心模型供应商和字节大模型战略的潜在竞争者——这种“既是合作伙伴又是竞争对手”的双重角色,将是观察未来中国Agent生态博弈的重要窗口。

6.3 国内外市场的关键差异

模型能力差距:国产大模型与GPT-5.5等顶尖模型仍存在代际差距,差距在快速缩小但短期内难以弥合。

生态“围墙花园”:各巨头更倾向于在自己的生态围墙内构建Agent体验。MCP等开放协议在国内的接受度有待观察。

监管的根本性变化:2026年Manus收购案被搁浅,标志着全球各主要经济体对AI底层技术跨境流动的监管进入前所未有的深水区。核心AI技术正在从“可自由流动的技术商品”变身为“受地缘逻辑约束的战略资产”,这为国内Agent厂商形成了一种事实上的保护性壁垒。

信创与国产化需求:中国企业客户更强调私有化部署和数据安全合规,这为国内厂商提供了天然护城河。这种需求结构也直接塑造了基础设施层格局——国内正在形成以Dify为核心的国产Agent框架生态,与海外LangGraph/CrewAI主导的体系形成事实上的“双轨制”格局。(基于当前监管趋势和信创政策的预判)

七、技术瓶颈与安全治理:Agent不能回避的深水区

7.1 四个核心技术瓶颈

瓶颈一:规划能力的不可靠性。 LLM在将高层目标分解为合理、可执行的子任务序列时仍是薄弱点。学术前沿正在探索让Agent在执行任务过程中自主发现和习得新技能的自演化框架,但尚未从根本上解决问题,更多是工程层面的优化。

瓶颈二:工具调用的鲁棒性不足。 MCP等协议解决了“能不能调”,但没完全解决“调得好不好”——参数识别错误、工具选择失误、多工具协同时的参数传递断裂仍时有发生。DeepSeek V3.2的“自反思”机制提供了正面案例,但行业整体水平仍有待提高。

瓶颈三:长期记忆与状态管理。 真正长期记忆需要解决存储、检索、整合和遗忘四个层面问题,远不是扩大上下文窗口能解决的。DeepSeek V4的100万Token上下文是工程突破,但当Agent从单轮工具调用转向多轮自主交互时,如何维持确定性目标导向成为新瓶颈。Hermes Agent采用的双文件记忆方案(MEMORY.md + USER.md)提供了一种轻量化解决思路,但其可扩展性和跨场景泛化能力还有待验证。

瓶颈四:评估体系的缺失。 如何定义和衡量Agent的“完成质量”?是看任务完成率、执行效率、中间步骤合理性,还是最终结果与用户预期的匹配度?业界缺乏统一标准。新加坡IMDA于2026年1月发布的全球首个专门针对自主Agent的治理框架(MGF),开始尝试在评估和问责层面建立标准。

7.2 安全危机:从“理论上存在”变成“正在发生”

2025年Q4到2026年初,Agent安全事件密集爆发。

ClawHavoc战役(OWASP于2026年1月正式披露,攻击活动发生于2025年11-12月):这是Agent生态史上规模最大的安全事件之一。涉及1184个恶意技能,通过12个被攻陷的发布者账户分发,影响247,693名确认安装用户,造成230万美元加密货币被盗。ClawHub上高达36.8%的插件被查出存在严重漏洞或被投毒,成百上千个恶意插件伪装成办公助手,直接扫荡用户的本地配置目录。这一事件深刻暴露了开放Agent生态的脆弱性——当万能钥匙被丢在赛博黑市,所有人都会遭殃。

MCP协议漏洞:利用MCP底层OAuth代理中的关键漏洞实施大规模攻击,暴露了标准化协议在创造效率的同时也创造了系统性单点故障目标。

AI辅助攻击的平民化:2025年12月,一名无技术背景的个人攻击者使用AI Agent工具入侵日本最大网咖连锁店,窃取超700万用户数据,动机仅仅是“想买宝可梦卡”。同期,攻击者利用AI Agent工具在一个月内对17个组织实施勒索,另一名攻击者入侵墨西哥政府超过10个机构,窃取1.95亿纳税人记录。

Lakera AI的监测数据提供了更系统的视角:攻击者已在利用AI Agent的工具调用能力扩展攻击面,间接提示词注入攻击的成功率高于直接注入,所需尝试次数更少。

7.3 责任归属:当Agent自己踩油门

2026年Q1,三件大事标志着行业同步抵达安全治理的临界点:新加坡IMDA发布首个Agent专项治理框架;英伟达发布开源安全运行时OpenShell;企业安全调查显示20%的企业在2025年经历了“影子AI”安全事件,每次平均额外损失67万美元。

核心问题:当Agent从“坐在副驾驶位帮你踩刹车”变成“自己踩油门”,整套围绕责任归属建立的法律逻辑、技术架构和商业合同都需要重写。Gartner预测,2026年将有三分之一的企业因过早部署AI而损害客户体验,侵蚀品牌信任。

应对路径包括:研发Agent专用安全审计工具(决策追溯记录),探索“沙盒执行”模式——让Agent在隔离的受控环境中执行关键操作,建立Agent分级分类管理制度(按自主程度和潜在危害划分),推进行业安全标准。

八、未来趋势:三条跑道,不同终点

基础设施层:走向“双轨制”

MCP和A2A协议将加速基础设施层标准化,但全球不会走向单一的“大统一”。由于数据安全、监管要求和信创政策,海外市场将由LangGraph、CrewAI等2-3个主流框架主导;中国市场则会形成以Dify为核心的国产框架生态。(基于当前监管趋势的预判)

能力增强层:安全将成为下一个百亿市场

当Agent开始接触企业核心数据和执行关键操作,“如何安全地让Agent连接一切”将成为全行业痛点。预计将涌现专门提供Agent安全网关、行为审计系统、权限管理平台的新公司,传统企业安全厂商也将切入这个领域。

终端应用层:三种玩家,三种策略

科技巨头走“生态收割”路线——以极低成本吸引海量用户,通过API、云服务和企业级解决方案变现。垂直行业创业公司最有希望走“价值深挖”路线——在医疗、法律、工业制造等领域把可靠性做到极致,用深度对抗广度。传统企业软件公司面临“被颠覆”威胁,但凭借客户关系、行业知识和数据壁垒,可能借Agent实现代际升级。

Cursor的“中间层危机”是终端应用层所有玩家的警示寓言:当底层模型厂商有能力推出更原生的Agent体验,应用层的价值需要被重新定义——不是“连接模型和用户的界面”,而是“模型做不到的、只有我能做的那个东西”。OpenClaw与Anthropic的“商业模式-开源生态”博弈则揭示了另一层逻辑:当平台补贴难以持续,开源社区的“免费午餐”随时可能被收回。而Hermes Agent依靠微信集成完成“国内化适配”的策略则说明,本地化渠道决定了分发效率——谁能率先接入用户日常使用的通讯平台,谁就能在获客战中占得先机。

技术融合的前景

Agent × 具身智能:当Agent不仅能调用软件工具还能控制机械臂或机器人,制造业将进入“黑灯工厂2.0”。Agent × 空间计算:Apple Vision Pro等设备为Agent提供了新维度,2-3年内更偏向概念验证。Agent × 量子计算:5年内实际影响有限。

 第三部分:纵横交汇——Agent当前所处的位置与未来走向 

一、历史规律中的当前位置

沿着AI Agent发展史往回看,一条规律浮现出来:Agent的每一次范式跃迁,都是由上一代范式的“核心痛点”驱动的。符号主义Agent→无法学习→联结主义范式崛起。机器学习Agent→无法泛化→预训练大模型范式崛起。LLM“聊天机器”→只会说不会做→Agent范式崛起。

当前我们正处于“工具增强型Agent”向“自主决策型Agent”过渡的早期阶段。从“工具增强”到“自主决策”的关键门槛,不在于模型能否写更复杂的代码,而在于能否具备持续性的目标和记忆。Hermes Agent的“自我进化”理念和OpenClaw的“7×24小时数字打工人”定位,都是朝这个方向迈出的重要探索。

二、竞争格局的核心张力

开放性 vs 控制力。 MCP、A2A等开放标准与厂商自有协议之争,决定Agent生态走向互联互通还是片区割据。DeepSeek通过开源策略构建的“无处不在却不露面”的生态渗透力,以及OpenClaw在生态压力下的社区韧性,都是开放路线的重要案例。但OpenClaw的遭遇也证明,开放生态的可持续性高度依赖底层模型厂商的商业策略——这是一场不对称博弈。

通用性 vs 可靠性。 通用Agent做得越多、出错概率越大。垂直Agent在中期内可能比通用Agent更赚钱——在明确边界内把可靠性做到极致。

技术领先 vs 生态锁定。 “框架层面的生态锁定”可能比“模型层面的品牌忠诚”更有商业价值。Hermes Agent通过微信原生集成快速蚕食OpenClaw用户基本盘,说明通讯平台的分发能力本身就是一种强锁定。

资本热度 vs 商业验证。 Agent商业化收入正在以惊人速度增长,但当前基础设施投资ROI约14%-17%,虽高于资本成本但远低于软件行业平均水平,是持续的结构性压力。

三、未来走向的判断

判断一:Agent不会“取代所有软件”,但会改变所有软件。

Agent将成为新的交互层,而非APP替代品——打车服务仍需要滴滴或Uber的调度系统,只是用户不再直接接触它们。

判断二:未来一到两年将出现Agent创业公司淘汰潮。

Gartner预测超过40%的Agentic AI项目将在2027年底前被取消。其中,没有核心技术、只做传统RPA包装的“Agent Washing”公司,以及没有明确垂直场景的通用Agent创业公司将最先被淘汰。OpenClaw与Anthropic的冲突暗示,高度依赖单一模型厂商补贴的Agent产品,商业模式具有内在脆弱性。这不意味着Agent方向错了——Web 1.0泡沫破裂后诞生的Web 2.0才是真正的赢家。

判断三:多Agent协作将成为下一个创新爆发点。

如果上一轮AI革命关于“一个模型能做什么”,下一轮可能关于“一群Agent能做什么”。Hermes Agent的“委派与并行”能力已初步验证了这一方向——Agent可以将子任务委派给其他Agent并行处理。

判断四:Agent安全将成为未来最重要但准备最不充分的议题。

ClawHavoc战役和MCP漏洞事件只是序幕。OpenClaw生态中36.8%的插件存在安全漏洞的数据,为整个行业敲响了警钟。

判断五:全球AI Agent市场的监管变局将持续深化。

Manus收购案搁浅所确立的“AI底层技术出海从严审查”先例,将深刻重塑全球AI创业公司的融资路径和退出策略。核心技术正从“可自由跨境流通的商品”转变为“受地缘逻辑约束的战略资产”,这一趋势在未来数年内只会加强而非减弱。

 四、结语:在“助手”和“代理人”之间 

回看AI Agent六十多年的发展史,最让人感慨的是,明斯基定义的Agent核心特征——感知环境、推理决策、执行任务——至今从未过时。只是实现这些能力的技术手段发生了天翻地覆的变化。

但有一个微妙的变化正在发生。传统的“助手”(assistant)提供建议,人做决策。而“代理人”(agent)在法律和商业语境中有更深的意味:代理人被授权代表委托人行事。当把AI称为agent而非assistant时,实际上在暗示一种更高程度的授权和信任。

这正是当前AI Agent产业最核心的未解课题:我们到底准备让AI走多远?

这个问题不会有标准答案。但可以确定的是,随着Agent可靠性提升、生态完善、成本下降,“代理人”的边界会不断向外扩张,“助手”的边界会不断向内收缩。而当OpenClaw以近28万Star登顶GitHub、当Hermes Agent以“自我进化”重新定义Agent成长路径、当第一批真实商业数据验证Agent的价值、当第一批安全事件暴露Agent的风险、当第一个重大监管裁决定义Agent的边界——或许我们正站在这个转折点上。

1956年达特茅斯会议上那批年轻的研究者试图用逻辑规则定义智能。七十年后的今天,我们发现智能的定义方式可能不是一条规则,而是一段演化的旅程——Agent,正是这段旅程最新的章回。

我们唯一能确定的是:这场始于符号逻辑、穿越大数据、来到大模型的漫长旅程,还远未到达终点。


参考资料说明: 本文所引用的数据、事件和观点主要来源于公开新闻报道、行业研究报告(Gartner、IDC、PitchBook、Belitsoft等)、公司官方披露(微软财报、Palantir财报、OpenAI、Anthropic及Nous Research官方信息)、OWASP安全事件记录、GitHub开源社区信息及学术论文(arXiv、ICLR 2026)。文中明确标注“推测”或“据行业估算”的内容为基于公开信息的逻辑推演。关于企业融资条款、内部决策信息等,应以相关公司官方披露为准。不同第三方机构因统计口径差异,市场规模数据可能存在不一致。SWE-bench得分数据来源于官方排行榜及公开信息。OpenClaw相关数据来源于其GitHub仓库、ClawHub社区及公开安全报告。Hermes Agent相关数据来源于Nous Research官方公告、GitHub仓库及ICLR 2026会议论文。

(全文完)


创作与来源说明

内容性质标注: 本文为基于行业趋势与公开信息的纪实风格深度推演研究,属于产业前瞻性分析与思想实验,并非实时新闻报道。文中所有涉及未来特定日期、监管决策、企业收购交易及产品发布的具体描述,均为基于现有发展逻辑的情景假设与前瞻性推演,并非已发生的确切事实。请读者在阅读时注意区分“已确认的史实”(2025年及以前)与“推演性判断”(未来时间线)。本文不构成对任何企业、个人或政府行为的抢先报道,相关事件的实际情况应以届时官方发布为准。

文中涉及各国监管政策的前瞻性描述,系作者基于行业趋势的独立判断,不代表任何政府机构立场,不应被解读为对政策走向的预测或承诺。

创作方式说明: 本文由AI辅助研究与撰写,经人工&AI多轮独立核查与校审修正后成文。选题判断、分析框架、逻辑架构、核心观点提炼与叙事节奏把控均由作者主导完成。AI工具主要用于资料检索、信息比对、初稿生成与文字润色。

事实核查说明: 文中所涉行业数据、技术事件及企业信息均引自公开报道、学术文献及市场研究机构。可追溯来源的数据已尽量标明出处。文中明确标注“推测”或“据行业估算”的内容为基于已有信息的逻辑推演,并非已证实的事实。关于企业内部决策、未公开融资条款等信息,应以相关公司官方披露或权威媒体报道为准。

时效说明: 本文信息截至2026年4月29日。AI Agent领域发展极快,文中引用的公司估值、融资状态、产品发布计划及监管政策可能在发布后发生变化,请关注最新动态。

免责声明

1. 非投资建议声明: 本文仅供产业研究参考,不构成任何形式的投资建议或商业决策指引。文中对特定公司、技术路线或商业模式的分析和判断,均为行业发展研究视角下的学术性讨论,不代表对相关公司证券价值的评估或对商业行动的建议。投资者应依赖自身判断或咨询持牌专业顾问。

2. 前瞻性陈述声明: 本文包含对未来趋势的判断、预测和展望。这些前瞻性陈述基于撰写时的公开信息和分析框架,受不确定性因素影响,可能与实际发展产生偏差,不构成对未来的承诺或保证。

3. 数据准确性说明: 不同第三方机构因统计口径和估算方法差异,部分数据(尤其是市场规模和收入预测)可能存在不一致。本文不能保证所有第三方数据的绝对精确性,读者引用时请以原始信源为准。

4. 版权与转载: 本文接受合理引用,但须标明出处。未经授权禁止洗稿、篡改或用于商业培训牟利。