从 ChatGPT 到 OpenClaw:我们站在新时代的前夜

2022 年 11 月 30 日，ChatGPT 正式公开发布。到 2026 年初，不过三年多时间。可如果把这三年压缩着看，你会发现，它几乎相当于互联网世界里一个时代的快进。

很多年后回头看，我们大概率会把这三年，视为 Agent 时代真正的序章。

今天回忆这段历史，最有意思的，不只是某个模型又刷新了多少分数，也不只是哪个产品又拿到了多少用户。真正重要的是：AI 的角色变了。

它一开始只是一个会说话的系统。后来，它变成了一个会调用工具的系统。再后来，它开始成为一个能独立完成任务、持续执行、与现实世界发生连接的行动系统。

这就是 Agent 的发展史。

它不是一个单点技术的爆发，而是一条非常清晰的演进主线：从“理解语言”，到“理解任务”，再到“进入环境、调用资源、完成行动”。

而我们现在，正站在这条曲线陡然上扬的位置。

一、2023：对话框时代——我们第一次认真和机器“相处”

如果要给 2023 年下一个定义，我会称它为：对话框时代。

这一年，很多人第一次认真地、持续地和 AI 交流。不是像过去那样把它当成搜索框、问答机或者语音助手，而是把它当成一个可以共同思考的对象。

那种感觉很奇妙。它知道很多知识，能写作、能翻译、能总结、能解释复杂概念；更重要的是，它有时还会给你一种错觉：它似乎也懂你。

这是一切的起点。

在能力上，这一阶段的核心突破，是大语言模型第一次以足够通用、足够低门槛、足够强的形式，进入普通人的日常认知流程。AI 从“隐藏在产品后面的算法能力”，第一次变成了一个可以被直接使用的前台对象。ChatGPT 的发布，把这种体验推向了主流世界。

但这一时期的 AI，本质上仍然是“语言层的智能”。

它擅长的是：

理解问题
生成文本
做解释、归纳、重写、头脑风暴
在一个对话上下文里维持较强的连贯性

它不真正拥有环境。它也不真正拥有行动。

换句话说，2023 年的 AI 很像一个极其博学、反应极快、表达极强的顾问，但还不是一个能下场办事的人。

所以这一年最典型的使用方式，是“我问，你答”。AI 像一个超级副驾驶，但还不是一个真正的执行者。

如果说 2023 年带来的最大变化是什么，那就是：人类第一次普遍接受了一件事——机器不只是能算，它也能理解和表达。

这是 Agent 时代的心理前提。

二、2024：工作流时代——AI 开始接触世界，但还没有真正进入世界

到了 2024 年，事情开始发生根本性变化。

人们不再满足于“和 AI 聊天”。大家开始想：能不能让它真正帮我做事？

于是，一个新的阶段到来了：工作流时代。

这一时期最典型的思路，不再是单纯对话，而是把 AI 嵌入现有软件和业务流程中。人们开始大量尝试：

把 AI 接到表单、客服、知识库、CRM、办公系统里
让 AI 负责意图识别、内容生成、信息提取、流程分发
通过编排、插件、工作流，把 AI 能力和现实系统连起来

这一阶段的重要意义，不是某一个产品本身，而是整个行业都开始意识到：

AI 的价值，不只在于回答问题，而在于接入流程。

所以 2024 年，围绕 Agent 的关键技术开始逐渐成型。最重要的有几类。

1. Tool Use：AI 不只是回答，而是调用

模型开始能更稳定地调用外部工具，比如搜索、代码执行、数据库、浏览器、表格、企业系统接口等。这意味着 AI 不再只是生成语言，而是开始通过工具“伸出手”。

2. Skill：AI 的能力开始被模块化

Skill 的出现，让 AI 的搜索、检索、总结、写作、执行、操作等能力，开始从一次性的 prompt 调用，变成可复用、可组合、可调度的模块。这意味着 AI 不再只是临时响应问题，而开始拥有更稳定的任务能力结构。

3. Workflow / Orchestration：AI 被放进更长的任务链里

AI 不再只处理一个 prompt，而是作为流程中的一个节点，与规则引擎、业务系统、数据库、审批链条一起工作。这让 AI 第一次具备了“参与生产流程”的可能。

4. Memory / Context Engineering：上下文变得比模型本身更重要

人们开始发现，同一个模型，接入不同上下文，结果差距巨大。于是，知识库、RAG、长期记忆、状态管理、上下文编排，开始成为 Agent 质量的关键。

5. MCP：能力接入开始标准化

2024 年 11 月，Anthropic 正式提出 Model Context Protocol（MCP）。它的意义在于，把“模型连接外部数据源和工具”的过程，从零散的私有集成，推进到更标准化的开放协议层。

MCP 的出现，本质上是在回答一个关键问题：如果未来所有 AI 都需要调用外部世界，那么它们该如何以统一方式接入外部世界？

这是一条非常重要的分水岭。因为从这一刻起，Agent 不再只是“一个更聪明的聊天机器人”，它开始拥有了真正的软件接口意义。

也正是在这个时期，行业里开始出现一个经典争论：

到底是 AI+APP，还是 APP+AI？

这个问题背后的本质是：未来的主角，到底还是传统应用，只是加上一个 AI 能力层；还是 AI 本身成为入口，再去动态调用各种应用和服务？

2024 年，这个问题还没有答案。但历史后来会证明：这不是二选一，而是一次权力重排。应用不会消失，但入口会迁移；功能不会消失，但调度权会迁移。

三、2025 上半年：Coding Agent 爆发——AI 第一次像“真正的执行者”

如果说 2024 年还是“AI 接入流程”的阶段，那么到了 2025 年初，Agent 终于迎来了一次具有历史意义的跃迁：

Coding Agent 爆发了。

这不是一个普通的产品更新。这是 AI 从“给建议”走向“直接交付结果”的关键时刻。

2025 年 2 月，Anthropic 发布 Claude 3.7 Sonnet，并推出 Claude Code；2025 年 5 月，OpenAI 正式推出 Codex。这两个产品虽然路径不同，但共同指向了一个事实：AI 已经不只是帮程序员补全代码，而是开始能够读代码、改代码、跑命令、调试、跨文件协作，并在更长时间跨度内持续完成任务。

这是为什么 2025 年初会出现一种强烈的社会情绪：很多程序员第一次真切地感到，危机不是一句空话了。

因为 coding assistant 和 coding agent 完全不是一回事。

前者是：“我写，你辅助。”

后者是：“我提目标，你去完成。”

这是本质区别。

而且编程之所以成为 Agent 最早爆发的主场，不是偶然。

因为代码世界天然具备几个非常适合 Agent 的条件：

任务目标相对明确
环境可被数字化描述
工具接口完备
反馈闭环清晰
错误可以快速验证
可以通过运行结果不断迭代

也就是说，软件开发是一个极其适合“规划—执行—校验—修正”闭环的环境。它几乎就是 Agent 的天然训练场。

所以真正重要的，不是“AI 会写代码”这件事本身，而是 AI 第一次在一个复杂、开放、需要多步推理和持续执行的环境里，证明了自己可以像一个行动者一样工作。

而 vibe coding 的流行，则把这种变化从开发者社区推向了更广泛的人群。

所谓 vibe coding，并不只是“让 AI 帮忙写点代码”这么简单。它背后真正发生的，是软件生产方式的门槛下降：

会描述问题的人，可以开始直接生产原型
懂业务的人，可以绕过一部分传统开发流程
创意和产品想法，第一次能以极低成本快速变成可运行的东西
软件制造，开始从“专业工种垄断”走向“更大规模的社会化参与”

这就是为什么 2025 年初开始，vibe coding 会突然大规模真实涌现。不是因为人们一夜之间都会编程了，而是因为 Agent 把“表达需求”与“交付系统”之间的距离，骤然拉近了。

这一步，意义极大。它让 Agent 不再只是企业级技术叙事，而第一次有了明确的社会扩散能力。

四、2025 下半年：从 Coding Agent 走向通用 Agent

但 2025 年真正更重要的变化，并不是 coding agent 本身。

而是从 2025 年中后期开始，行业越来越清楚地意识到：coding 只是第一站，不是终点。

随着模型能力、工具使用能力、长上下文能力、状态保持能力、技能封装能力的增强，Agent 开始从“程序员工具”走向“更广泛任务代理”。

这一时期，有两个信号非常关键。

第一个信号：Codex 自身开始平台化

OpenAI 在 2025 年 10 月宣布 Codex generally available，并增加了 Slack 集成、Codex SDK、管理与监控能力。到 2026 年 2 月，又发布了 Codex app，把它定位成“agents 的指挥中心”。这说明 Codex 的定位已经不只是一个 coding 工具，而是一个更广义的 agent 工作台和任务系统。

第二个信号：Claude 系列开始显著强化 Agent 能力

Anthropic 在 2025 年 5 月发布 Claude 4 时，明确强调其在 复杂长任务与 agent workflows 上的持续表现；到 2025 年 11 月，Claude Opus 4.5 被 Anthropic 直接描述为 “self-improving AI agents” 的突破，强调它可以在办公室自动化与技术任务中从经验中学习、迭代能力。2026 年 2 月的 Claude Opus 4.6 和 Sonnet 4.6 又进一步强化了长任务、规划、代码审查、电脑使用、1M 上下文等能力。

这意味着什么？

意味着 Agent 的核心能力栈，已经不再局限于“会不会写代码”，而逐渐变成一整套更通用的执行体系：

更强的任务分解与规划
更稳的工具调用
更长的上下文保持
更好的错误恢复
更强的状态管理
更成熟的技能封装
更接近真实工作的持续执行能力

在这个阶段，Agent 开始第一次显示出一种真正像“数字劳动力”的轮廓。它不再只是一个回答器，也不只是一个脚本触发器，而是在越来越多场景中，接近一个可以持续工作的“角色”。

这就是 2025 年末最重要的历史意义：

Agent 开始从一个技术概念，变成一个社会角色。

五、2026：OpenClaw 破圈——Agent 第一次真正走向大众社会

如果说 2025 年是 Agent 完成技术台阶跃迁的一年，那么 2026 年初，很可能会被记住为：

Agent 第一次真正走向大众社会的一年。

这个标志性事件之一，就是 OpenClaw。

它在短时间内就已拥有超过 10 万 GitHub stars，并在一周内吸引 200 万访问者。到 2026 年 3 月，GitHub 页面显示其 star 数已超过 32 万；同期 Reuters、Financial Times 等媒体都报道了它在中国引发的“养龙虾”式热潮，以及腾讯、百度等公司迅速跟进，将 OpenClaw 类能力接入各自生态。

为什么 OpenClaw 这么重要？

因为它让 Agent 从“专业用户在专业软件里使用的能力”，变成了一个普通人也能想象、讨论、配置、炫耀、模仿和传播的社会对象。

它的重要性，不只在产品层面，更在社会层面。

它第一次大规模地让人们看到：

Agent 可以运行在本地或个人环境里
Agent 可以连到聊天工具、文件、浏览器、日程、设备
Agent 不一定附着在某一个单独 APP 中
Agent 可以像一个持续在线的数字分身一样存在
人们可以“养”一个 Agent，而不只是“使用”一个 AI 功能

从这个意义上说，OpenClaw 像是 Agent 时代的一个文化事件。它让 Agent 第一次从技术圈名词，变成了一种大众叙事。

当然，它也同步暴露了大量问题。媒体和安全研究都开始提醒其在权限控制、数据安全、恶意技能、提示注入等方面的风险。也正因此，2026 年的另一个关键词已经浮现出来：

Agent 安全与治理。

但这恰恰说明，它已经从实验室问题，变成了社会问题。而一个技术一旦变成社会问题，往往意味着它真的来了。

六、回头看这三年，Agent 到底发生了什么变化？

如果把 2023 到 2026 这三年压成一条线，你会发现 Agent 的演进，本质上经历了四次跃迁。

第一次跃迁：从“知识回答”到“认知陪伴”

2023 年，AI 首先证明了自己可以作为一个通用认知对象存在。它能说、能写、能解释、能陪你一起思考。

第二次跃迁：从“认知陪伴”到“流程嵌入”

2024 年，AI 开始进入表格、文档、客服、知识库、企业系统、工作流。它不再只存在于对话框里，而是开始接入软件世界。

第三次跃迁：从“流程嵌入”到“任务执行”

2025 年初，coding agent 爆发。AI 第一次在复杂环境中，持续完成多步任务，证明自己可以成为执行者。

第四次跃迁：从“任务执行”到“社会角色”

2025 年末到 2026 年初，通用 Agent 和 OpenClaw 式产品开始扩散。Agent 不再只是工具，而开始像一个“数字角色”进入社会分工。

这四次跃迁加在一起，构成了 Agent 的真正历史。

七、未来：Agent 将全面进入社会，一个新时代就要来了

接下来会发生什么？

我越来越确信，未来几年最重要的变化，不会只是“模型更强了”，而是：

Agent 将全面进入社会。

这里的“进入社会”，不是一句夸张的话。它至少会发生在三个层面。

1. 进入个人生活

每个人都会逐渐拥有自己的 Agent。它会连接你的日程、消息、文件、偏好、习惯、设备与长期目标。它不只是回答你，而是开始替你组织生活、处理信息、推进事务。

2. 进入组织运行

企业会越来越多地把 Agent 视为新的生产要素。很多原来由人手工完成的协调、整理、分析、跟进、触达、执行动作，会被 Agent 接管。组织的流程、系统、权限、知识库，也会重新围绕“人机协同”和“Agent 执行”来设计。

3. 进入公共基础设施

未来的很多数字服务，不会再只是“一个 APP 提供一个功能”，而会逐渐变成“多个系统向 Agent 暴露可调用能力”。软件的世界，会从“人操作界面”进一步转向“Agent 调用能力”。

到那个时候，我们今天讨论的很多问题——是 AI+APP 还是 APP+AI？要不要做工作流？MCP 重不重要？Skill 会不会成为新入口？为什么 coding agent 先爆发？——都会变得非常清楚。

因为它们本质上都指向同一件事：

软件世界正在从“给人用”转向“既给人用，也给 Agent 用”。

而一个新的时代，往往不是在口号响起时开始的，而是在基础设施悄悄完成迁移的时候开始的。

今天，我们正站在这个迁移的门口。

三年前，我们惊讶于机器终于可以和我们顺畅对话。两年前，我们开始尝试把 AI 接进工作流。一年前，我们第一次看到它可以像一个工程师一样持续执行。而今天，我们已经开始看到它走出 IDE、走出实验室、走进聊天工具、走进组织流程、走进普通人的日常生活。

历史的前几页，已经写完了。真正的大章节，才刚刚开始。