2022 年 11 月 30 日,ChatGPT 正式公开发布。到 2026 年初,不过三年多时间。可如果把这三年压缩着看,你会发现,它几乎相当于互联网世界里一个时代的快进。
很多年后回头看,我们大概率会把这三年,视为 Agent 时代真正的序章。
今天回忆这段历史,最有意思的,不只是某个模型又刷新了多少分数,也不只是哪个产品又拿到了多少用户。真正重要的是:AI 的角色变了。
它一开始只是一个会说话的系统。后来,它变成了一个会调用工具的系统。再后来,它开始成为一个能独立完成任务、持续执行、与现实世界发生连接的行动系统。
这就是 Agent 的发展史。
它不是一个单点技术的爆发,而是一条非常清晰的演进主线:从“理解语言”,到“理解任务”,再到“进入环境、调用资源、完成行动”。
而我们现在,正站在这条曲线陡然上扬的位置。
一、2023:对话框时代——我们第一次认真和机器“相处”
如果要给 2023 年下一个定义,我会称它为:对话框时代。
这一年,很多人第一次认真地、持续地和 AI 交流。不是像过去那样把它当成搜索框、问答机或者语音助手,而是把它当成一个可以共同思考的对象。
那种感觉很奇妙。它知道很多知识,能写作、能翻译、能总结、能解释复杂概念;更重要的是,它有时还会给你一种错觉:它似乎也懂你。
这是一切的起点。
在能力上,这一阶段的核心突破,是大语言模型第一次以足够通用、足够低门槛、足够强的形式,进入普通人的日常认知流程。AI 从“隐藏在产品后面的算法能力”,第一次变成了一个可以被直接使用的前台对象。ChatGPT 的发布,把这种体验推向了主流世界。
但这一时期的 AI,本质上仍然是“语言层的智能”。
它擅长的是:
理解问题
生成文本
做解释、归纳、重写、头脑风暴
在一个对话上下文里维持较强的连贯性
它不真正拥有环境。它也不真正拥有行动。
换句话说,2023 年的 AI 很像一个极其博学、反应极快、表达极强的顾问,但还不是一个能下场办事的人。
所以这一年最典型的使用方式,是“我问,你答”。AI 像一个超级副驾驶,但还不是一个真正的执行者。
如果说 2023 年带来的最大变化是什么,那就是:人类第一次普遍接受了一件事——机器不只是能算,它也能理解和表达。
这是 Agent 时代的心理前提。
二、2024:工作流时代——AI 开始接触世界,但还没有真正进入世界
到了 2024 年,事情开始发生根本性变化。
人们不再满足于“和 AI 聊天”。大家开始想:能不能让它真正帮我做事?
于是,一个新的阶段到来了:工作流时代。
这一时期最典型的思路,不再是单纯对话,而是把 AI 嵌入现有软件和业务流程中。人们开始大量尝试:
把 AI 接到表单、客服、知识库、CRM、办公系统里
让 AI 负责意图识别、内容生成、信息提取、流程分发
通过编排、插件、工作流,把 AI 能力和现实系统连起来
这一阶段的重要意义,不是某一个产品本身,而是整个行业都开始意识到:
AI 的价值,不只在于回答问题,而在于接入流程。
所以 2024 年,围绕 Agent 的关键技术开始逐渐成型。最重要的有几类。
1. Tool Use:AI 不只是回答,而是调用
模型开始能更稳定地调用外部工具,比如搜索、代码执行、数据库、浏览器、表格、企业系统接口等。这意味着 AI 不再只是生成语言,而是开始通过工具“伸出手”。
2. Skill:AI 的能力开始被模块化
Skill 的出现,让 AI 的搜索、检索、总结、写作、执行、操作等能力,开始从一次性的 prompt 调用,变成可复用、可组合、可调度的模块。这意味着 AI 不再只是临时响应问题,而开始拥有更稳定的任务能力结构。
3. Workflow / Orchestration:AI 被放进更长的任务链里
AI 不再只处理一个 prompt,而是作为流程中的一个节点,与规则引擎、业务系统、数据库、审批链条一起工作。这让 AI 第一次具备了“参与生产流程”的可能。
4. Memory / Context Engineering:上下文变得比模型本身更重要
人们开始发现,同一个模型,接入不同上下文,结果差距巨大。于是,知识库、RAG、长期记忆、状态管理、上下文编排,开始成为 Agent 质量的关键。
5. MCP:能力接入开始标准化
2024 年 11 月,Anthropic 正式提出 Model Context Protocol(MCP)。它的意义在于,把“模型连接外部数据源和工具”的过程,从零散的私有集成,推进到更标准化的开放协议层。
MCP 的出现,本质上是在回答一个关键问题:如果未来所有 AI 都需要调用外部世界,那么它们该如何以统一方式接入外部世界?
这是一条非常重要的分水岭。因为从这一刻起,Agent 不再只是“一个更聪明的聊天机器人”,它开始拥有了真正的软件接口意义。
也正是在这个时期,行业里开始出现一个经典争论:
到底是 AI+APP,还是 APP+AI?
这个问题背后的本质是:未来的主角,到底还是传统应用,只是加上一个 AI 能力层;还是 AI 本身成为入口,再去动态调用各种应用和服务?
2024 年,这个问题还没有答案。但历史后来会证明:这不是二选一,而是一次权力重排。应用不会消失,但入口会迁移;功能不会消失,但调度权会迁移。
三、2025 上半年:Coding Agent 爆发——AI 第一次像“真正的执行者”
如果说 2024 年还是“AI 接入流程”的阶段,那么到了 2025 年初,Agent 终于迎来了一次具有历史意义的跃迁:
Coding Agent 爆发了。
这不是一个普通的产品更新。这是 AI 从“给建议”走向“直接交付结果”的关键时刻。
2025 年 2 月,Anthropic 发布 Claude 3.7 Sonnet,并推出 Claude Code;2025 年 5 月,OpenAI 正式推出 Codex。这两个产品虽然路径不同,但共同指向了一个事实:AI 已经不只是帮程序员补全代码,而是开始能够读代码、改代码、跑命令、调试、跨文件协作,并在更长时间跨度内持续完成任务。
这是为什么 2025 年初会出现一种强烈的社会情绪:很多程序员第一次真切地感到,危机不是一句空话了。
因为 coding assistant 和 coding agent 完全不是一回事。
前者是:“我写,你辅助。”
后者是:“我提目标,你去完成。”
这是本质区别。
而且编程之所以成为 Agent 最早爆发的主场,不是偶然。
因为代码世界天然具备几个非常适合 Agent 的条件:
任务目标相对明确
环境可被数字化描述
工具接口完备
反馈闭环清晰
错误可以快速验证
可以通过运行结果不断迭代
也就是说,软件开发是一个极其适合“规划—执行—校验—修正”闭环的环境。它几乎就是 Agent 的天然训练场。
所以真正重要的,不是“AI 会写代码”这件事本身,而是 AI 第一次在一个复杂、开放、需要多步推理和持续执行的环境里,证明了自己可以像一个行动者一样工作。
而 vibe coding 的流行,则把这种变化从开发者社区推向了更广泛的人群。
所谓 vibe coding,并不只是“让 AI 帮忙写点代码”这么简单。它背后真正发生的,是软件生产方式的门槛下降:
会描述问题的人,可以开始直接生产原型
懂业务的人,可以绕过一部分传统开发流程
创意和产品想法,第一次能以极低成本快速变成可运行的东西
软件制造,开始从“专业工种垄断”走向“更大规模的社会化参与”
这就是为什么 2025 年初开始,vibe coding 会突然大规模真实涌现。不是因为人们一夜之间都会编程了,而是因为 Agent 把“表达需求”与“交付系统”之间的距离,骤然拉近了。
这一步,意义极大。它让 Agent 不再只是企业级技术叙事,而第一次有了明确的社会扩散能力。
四、2025 下半年:从 Coding Agent 走向通用 Agent
但 2025 年真正更重要的变化,并不是 coding agent 本身。
而是从 2025 年中后期开始,行业越来越清楚地意识到:coding 只是第一站,不是终点。
随着模型能力、工具使用能力、长上下文能力、状态保持能力、技能封装能力的增强,Agent 开始从“程序员工具”走向“更广泛任务代理”。
这一时期,有两个信号非常关键。
第一个信号:Codex 自身开始平台化
OpenAI 在 2025 年 10 月宣布 Codex generally available,并增加了 Slack 集成、Codex SDK、管理与监控能力。到 2026 年 2 月,又发布了 Codex app,把它定位成“agents 的指挥中心”。这说明 Codex 的定位已经不只是一个 coding 工具,而是一个更广义的 agent 工作台和任务系统。
第二个信号:Claude 系列开始显著强化 Agent 能力
Anthropic 在 2025 年 5 月发布 Claude 4 时,明确强调其在 复杂长任务与 agent workflows 上的持续表现;到 2025 年 11 月,Claude Opus 4.5 被 Anthropic 直接描述为 “self-improving AI agents” 的突破,强调它可以在办公室自动化与技术任务中从经验中学习、迭代能力。2026 年 2 月的 Claude Opus 4.6 和 Sonnet 4.6 又进一步强化了长任务、规划、代码审查、电脑使用、1M 上下文等能力。
这意味着什么?
意味着 Agent 的核心能力栈,已经不再局限于“会不会写代码”,而逐渐变成一整套更通用的执行体系:
更强的任务分解与规划
更稳的工具调用
更长的上下文保持
更好的错误恢复
更强的状态管理
更成熟的技能封装
更接近真实工作的持续执行能力
在这个阶段,Agent 开始第一次显示出一种真正像“数字劳动力”的轮廓。它不再只是一个回答器,也不只是一个脚本触发器,而是在越来越多场景中,接近一个可以持续工作的“角色”。
这就是 2025 年末最重要的历史意义:
Agent 开始从一个技术概念,变成一个社会角色。
五、2026:OpenClaw 破圈——Agent 第一次真正走向大众社会
如果说 2025 年是 Agent 完成技术台阶跃迁的一年,那么 2026 年初,很可能会被记住为:
Agent 第一次真正走向大众社会的一年。
这个标志性事件之一,就是 OpenClaw。
它在短时间内就已拥有超过 10 万 GitHub stars,并在一周内吸引 200 万访问者。到 2026 年 3 月,GitHub 页面显示其 star 数已超过 32 万;同期 Reuters、Financial Times 等媒体都报道了它在中国引发的“养龙虾”式热潮,以及腾讯、百度等公司迅速跟进,将 OpenClaw 类能力接入各自生态。
为什么 OpenClaw 这么重要?
因为它让 Agent 从“专业用户在专业软件里使用的能力”,变成了一个普通人也能想象、讨论、配置、炫耀、模仿和传播的社会对象。
它的重要性,不只在产品层面,更在社会层面。
它第一次大规模地让人们看到:
Agent 可以运行在本地或个人环境里
Agent 可以连到聊天工具、文件、浏览器、日程、设备
Agent 不一定附着在某一个单独 APP 中
Agent 可以像一个持续在线的数字分身一样存在
人们可以“养”一个 Agent,而不只是“使用”一个 AI 功能
从这个意义上说,OpenClaw 像是 Agent 时代的一个文化事件。它让 Agent 第一次从技术圈名词,变成了一种大众叙事。
当然,它也同步暴露了大量问题。媒体和安全研究都开始提醒其在权限控制、数据安全、恶意技能、提示注入等方面的风险。也正因此,2026 年的另一个关键词已经浮现出来:
Agent 安全与治理。
但这恰恰说明,它已经从实验室问题,变成了社会问题。而一个技术一旦变成社会问题,往往意味着它真的来了。
六、回头看这三年,Agent 到底发生了什么变化?
如果把 2023 到 2026 这三年压成一条线,你会发现 Agent 的演进,本质上经历了四次跃迁。
第一次跃迁:从“知识回答”到“认知陪伴”
2023 年,AI 首先证明了自己可以作为一个通用认知对象存在。它能说、能写、能解释、能陪你一起思考。
第二次跃迁:从“认知陪伴”到“流程嵌入”
2024 年,AI 开始进入表格、文档、客服、知识库、企业系统、工作流。它不再只存在于对话框里,而是开始接入软件世界。
第三次跃迁:从“流程嵌入”到“任务执行”
2025 年初,coding agent 爆发。AI 第一次在复杂环境中,持续完成多步任务,证明自己可以成为执行者。
第四次跃迁:从“任务执行”到“社会角色”
2025 年末到 2026 年初,通用 Agent 和 OpenClaw 式产品开始扩散。Agent 不再只是工具,而开始像一个“数字角色”进入社会分工。
这四次跃迁加在一起,构成了 Agent 的真正历史。
七、未来:Agent 将全面进入社会,一个新时代就要来了
接下来会发生什么?
我越来越确信,未来几年最重要的变化,不会只是“模型更强了”,而是:
Agent 将全面进入社会。
这里的“进入社会”,不是一句夸张的话。它至少会发生在三个层面。
1. 进入个人生活
每个人都会逐渐拥有自己的 Agent。它会连接你的日程、消息、文件、偏好、习惯、设备与长期目标。它不只是回答你,而是开始替你组织生活、处理信息、推进事务。
2. 进入组织运行
企业会越来越多地把 Agent 视为新的生产要素。很多原来由人手工完成的协调、整理、分析、跟进、触达、执行动作,会被 Agent 接管。组织的流程、系统、权限、知识库,也会重新围绕“人机协同”和“Agent 执行”来设计。
3. 进入公共基础设施
未来的很多数字服务,不会再只是“一个 APP 提供一个功能”,而会逐渐变成“多个系统向 Agent 暴露可调用能力”。软件的世界,会从“人操作界面”进一步转向“Agent 调用能力”。
到那个时候,我们今天讨论的很多问题——是 AI+APP 还是 APP+AI?要不要做工作流?MCP 重不重要?Skill 会不会成为新入口?为什么 coding agent 先爆发?——都会变得非常清楚。
因为它们本质上都指向同一件事:
软件世界正在从“给人用”转向“既给人用,也给 Agent 用”。
而一个新的时代,往往不是在口号响起时开始的,而是在基础设施悄悄完成迁移的时候开始的。
今天,我们正站在这个迁移的门口。
三年前,我们惊讶于机器终于可以和我们顺畅对话。两年前,我们开始尝试把 AI 接进工作流。一年前,我们第一次看到它可以像一个工程师一样持续执行。而今天,我们已经开始看到它走出 IDE、走出实验室、走进聊天工具、走进组织流程、走进普通人的日常生活。
历史的前几页,已经写完了。真正的大章节,才刚刚开始。
夜雨聆风