AI_Agent第二章智能体发展史_公众号初稿

AI Agent 发展史：机器是怎么从“背规则”学会“办事情”的？

本文基于 Datawhale 开源教程《Hello-Agents：从零开始构建智能体》第二章“智能体发展史”整理改写。原章内容很系统，本文做了公众号向裁剪：少讲技术细节，多讲发展主线，适合没有计算机背景的读者理解。

智能体发展史时间线

如果说第一章我们认识了 Agent 是什么，那么第二章要回答一个更有意思的问题：

AI Agent 是怎么一路长成今天这个样子的？

它不是从天而降的，也不是 ChatGPT 一上线，世界突然多了一个新物种。更像是 AI 这门学科一路“试错、撞墙、转弯、再出发”的结果。

早期的人想让机器学会推理；后来的人想让机器记住专家经验；再后来，人们发现机器还要能学习、能协作、能使用工具。折腾几十年后，今天的 LLM Agent 才站到了舞台中央。

这段历史有点像一家公司培养新人：一开始让他背制度，后来让他跟专家学，再后来让他自己实践复盘，最后终于敢把一部分任务交给他做。

当然，前提是别让他直接管财务章。

一、最早的梦想：让机器像逻辑学家一样思考

AI 早期有一个非常朴素，也非常宏大的想法：

既然人类能用符号和逻辑思考，那机器是不是也可以？

于是，符号主义 AI 登场了。

符号主义 AI 工作方式

符号主义的核心思路可以理解为：把世界拆成一个个清楚的概念，再用规则把它们连起来。

比如：

? 鸟会飞。

? 企鹅是鸟。

? 企鹅不会飞。

你看，麻烦来了。第一条和第三条一碰面，逻辑系统就开始冒汗。

这也是符号主义 AI 的典型气质：它特别擅长处理规则清楚、边界明确的问题。像数学证明、棋类搜索、专家规则推理，都很适合它。它像一位严谨的图书管理员，每张卡片都放得整整齐齐。

但现实世界偏偏不是图书馆。现实世界更像菜市场：吵、乱、有例外，还有人临时改需求。

所以符号主义的优势很明显：透明、可解释、可追踪。

它的问题也很明显：规则要人写，例外太多时系统会越来越笨重。

一句话总结：早期 AI 很会讲逻辑，但生活不总讲逻辑。

二、专家系统：把老师傅装进机器里

到了 20 世纪 70 到 80 年代，AI 研究出现了一个很实用的方向：专家系统。

听名字就很有年代感，像一台穿白大褂的电脑。

专家系统的想法是：既然医生、工程师、金融专家有大量经验，那我们能不能把这些经验写成规则，让机器帮忙判断？

它的工作方式大概是：

如果出现症状 A 和症状 B，并且检测结果 C 为阳性，那么可能是疾病 X。

这种系统在一些专业领域确实有过亮眼表现。因为在特定范围内，专家经验是能被规则化的。比如设备故障诊断、医学辅助判断、配置推荐等。

但它也遇到一个很现实的问题：专家的知识并不总是能说清楚。

老师傅修机器时可能看一眼、听一声，就知道哪里不对。你问他怎么判断的，他说：“感觉不对。”

这就麻烦了。机器最怕这种回答。你不能往系统里写：

IF 老师傅感觉不对 THEN 赶紧检查。

专家系统后来遇到的一个瓶颈，就叫知识获取瓶颈：很多知识存在于人的经验、直觉和场景判断里，很难完整写成规则。

这像是让一位厨师把“少许盐”“差不多熟了”“火候到了”全部精确成公式。厨师会沉默，锅也会沉默。

三、ELIZA：机器第一次让人觉得“它懂我”

讲 AI 对话史，绕不开 ELIZA。

ELIZA 是 Joseph Weizenbaum 在 1960 年代开发的早期聊天程序。它最有名的版本模仿心理咨询师，会把用户的话稍微改写后抛回去。

ELIZA 效应示意图

比如你说：

“我最近很焦虑。”

它可能回：

“你为什么觉得自己很焦虑？”

你说：

“我总担心工作做不好。”

它继续：

“你能多说说工作做不好这件事吗？”

熟悉吗？像不像某些会议里那位永远在说“我们再展开聊聊”的同事。

ELIZA 的厉害之处，不在于它真的理解了你，而在于它用非常简单的模式匹配，让人产生了“它在理解我”的感觉。

这后来被称为 ELIZA effect：人类很容易把理解、意图、情感投射到机器身上。

这件事放到今天依然重要。大语言模型比 ELIZA 强大太多，但用户仍然需要记住一件事：

会回应，不等于真理解；说得像，不等于一定对。

这不是贬低 AI，而是提醒我们不要被流畅表达迷惑。一个回答很丝滑的系统，也可能只是错得很有礼貌。

四、心智社会：智能也许不是一个“大脑”，而是一群“小助手”

后来，Marvin Minsky 提出了一个很有启发性的想法：智能并不一定来自一个单一的超级大脑，它可能来自很多小模块的协作。

这就是“心智社会”的思路。

你可以把它想象成一个办公室：

? 有人负责记忆。

? 有人负责计划。

? 有人负责判断风险。

? 有人负责和外界沟通。

? 有人负责检查结果。

单独看，每个人能力都有限；合在一起，就能完成复杂任务。

这个观点对今天的多智能体系统很有启发。现代 Agent 系统里，我们经常会看到类似分工：

? 规划 Agent：负责拆解任务。

? 执行 Agent：负责调用工具。

? 评审 Agent：负责检查质量。

? 记忆模块：负责保存偏好和上下文。

看起来像一家公司，只是员工都是 AI。

这也解释了为什么现在很多 Agent 框架喜欢模拟团队协作。复杂任务本来就不是一个“万能脑袋”能轻松搞定的，它更像一个流程，需要分工、反馈和协调。

当然，多 Agent 也不是越多越好。三个 Agent 可能像团队协作，三十个 Agent 可能像群聊失控。每个人都在发表意见，最后没人交付结果。

五、从写规则到学经验：机器学习改变了方向

符号主义和专家系统的共同特点是：很多知识要先由人类写进去。

后来，AI 的方向发生了重要变化：

与其让人把规则全写出来，不如让机器从数据和反馈里自己学。

机器学习、深度学习、强化学习陆续成为主角。

其中，强化学习和 Agent 特别亲近。因为它天然就是一个“智能体和环境互动”的故事：

智能体做动作，环境给反馈，系统根据奖励调整策略。

强化学习闭环

这和人类学习很像。

小孩第一次骑自行车，摔了，痛，调整平衡。

打游戏时乱按技能，被打爆，下一局换策略。

做饭盐放多了，家人沉默，下一次少放一点。

强化学习就是把这种“试一试、看结果、再改进”的过程数学化。

AlphaGo 的成功，就是这一脉络的标志性事件之一。它让很多人意识到：机器不只是能按规则走，还能通过大量训练发现人类未必总结过的策略。

但强化学习也有代价。它通常需要大量试错，而现实世界并不总允许你无限试错。

比如游戏里试错没关系，输了重开。

自动驾驶里试错就不行，错一次可能就是事故。

投资系统里试错也不便宜，错一次可能财务总监血压上来。

所以学习型智能体很强，但真正落地时必须考虑成本、安全和边界。

六、大语言模型登场：Agent 终于有了通用“大脑”

到了大语言模型时代，事情又变了。

过去很多 Agent 系统都很专用。下棋的会下棋，导航的会导航，诊断的会诊断。它们在自己的地盘很强，但换个场景就不一定能干活。

大语言模型带来的变化是：它能理解自然语言，能处理上下文，能生成计划，还能和各种工具连接。

这让 Agent 的形态发生了变化：

以前我们要写很多具体规则。

现在我们可以给模型一个目标，让它拆解任务、调用工具、观察结果，再继续调整。

现代 LLM Agent 技术栈

比如你说：

“帮我整理一份 AI Agent 的入门文章，要适合普通读者，风格幽默一点，最后生成 Word 文档。”

一个 LLM Agent 可能会做这些事：

理解目标：这是公众号文章，不是论文。
拆解任务：先找资料，再提纲，再写稿，再配图，再转格式。
调用工具：访问网页、生成图片、读写文件。
观察反馈：用户说图片重叠了，就修改图片。
继续交付：再生成 docx 或封面图。

你会发现，这不正是我们现在正在做的事吗？

现代 Agent 的关键，不只是大模型本身更聪明，而是它被放进了一个可以行动的系统里。

这个系统通常包括：

? 记忆：记住用户偏好、上下文和历史信息。

? 规划：把大目标拆成小步骤。

? 工具：搜索、计算、写文件、调用 API。

? 反馈：观察执行结果，必要时修正。

? 约束：限制权限，避免乱来。

所以，LLM Agent 不是“一个模型包打天下”。它更像一支小队：模型负责理解和推理，工具负责执行，记忆负责连续性，规则负责安全边界。

七、历史给我们的几个提醒

看完这段发展史，我们能得到几个很实用的判断。

第一，别迷信“全自动”。

从专家系统到现代 Agent，人们一直想让机器替人完成复杂任务。但越复杂的任务，越需要边界、验证和人工介入。全自动听起来很美，出错时也很刺激。

第二，别看不起规则。

现在大家都在聊大模型，但规则并没有过时。报销审批、权限控制、合规检查、风控阈值，这些地方规则依然很重要。一个可靠的系统，往往是规则和模型配合，而不是谁彻底取代谁。

第三，别把“会说”当成“会做”。

ELIZA 很早就证明，人类容易被对话感打动。今天的 LLM 更会表达，我们更要多看它是否能完成任务、是否有证据、是否能被检查。

第四，Agent 的未来不是一个超级大脑独自表演。

更可能是：模型、工具、工作流、记忆、评估、安全机制一起组成系统。真正有价值的不是“AI 很聪明”，而是“AI 能在正确边界内完成正确任务”。

八、总结：Agent 的历史，其实是 AI 学会办事的历史

如果把 AI Agent 的发展压缩成一条线，可以这样理解：

早期符号主义 AI 让机器学会按逻辑推理。

专家系统让机器尝试吸收人类专家经验。

ELIZA 让人第一次强烈感到机器也能“对话”。

心智社会和多智能体思想提示我们：复杂智能可能来自分工协作。

机器学习和强化学习让智能体能通过数据和反馈改进策略。

大语言模型则把自然语言理解、规划和工具调用连接起来，让 Agent 进入大众视野。

所以，今天的 Agent 不是某个单点技术突然爆炸，而是几十年 AI 思想的合流。

它继承了符号主义的规则意识，借鉴了专家系统的领域知识，吸收了机器学习的经验改进，也依赖大语言模型的通用理解能力。

一句话总结：

AI Agent 的发展史，就是机器从“背规则”到“学经验”，再到“带着工具完成目标”的过程。

它还没有变成电影里的全能助手，但已经从“只会回答问题”走向“能参与完成任务”。

这一步，才是真正值得关注的地方。

参考资料

1. Datawhale，《Hello-Agents：从零开始构建智能体》在线阅读：https://hello-agents.datawhale.cc/#/./README

2. Datawhale，第二章《智能体发展史》GitHub 源文档：https://github.com/datawhalechina/hello-agents/blob/main/docs/chapter2/%E7%AC%AC%E4%BA%8C%E7%AB%A0%20%E6%99%BA%E8%83%BD%E4%BD%93%E5%8F%91%E5%B1%95%E5%8F%B2.md

3. Allen Newell, Herbert A. Simon, “Computer Science as Empirical Inquiry: Symbols and Search”：https://dl.acm.org/doi/10.1145/360018.360022

4. Joseph Weizenbaum, “ELIZA, a computer program for the study of natural language communication between man and machine”：https://dl.acm.org/doi/10.1145/365153.365168

5. Marvin Minsky, The Society of Mind：https://archive.org/details/societyofmind00mins

6. David Silver et al., “Mastering the game of Go with deep neural networks and tree search”：https://www.nature.com/articles/nature16961