AI Agent 发展史:机器是怎么从“背规则”学会“办事情”的?
本文基于 Datawhale 开源教程《Hello-Agents:从零开始构建智能体》第二章“智能体发展史”整理改写。原章内容很系统,本文做了公众号向裁剪:少讲技术细节,多讲发展主线,适合没有计算机背景的读者理解。
智能体发展史时间线如果说第一章我们认识了 Agent 是什么,那么第二章要回答一个更有意思的问题:它不是从天而降的,也不是 ChatGPT 一上线,世界突然多了一个新物种。更像是 AI 这门学科一路“试错、撞墙、转弯、再出发”的结果。早期的人想让机器学会推理;后来的人想让机器记住专家经验;再后来,人们发现机器还要能学习、能协作、能使用工具。折腾几十年后,今天的 LLM Agent 才站到了舞台中央。这段历史有点像一家公司培养新人:一开始让他背制度,后来让他跟专家学,再后来让他自己实践复盘,最后终于敢把一部分任务交给他做。一、最早的梦想:让机器像逻辑学家一样思考
符号主义 AI 工作方式符号主义的核心思路可以理解为:把世界拆成一个个清楚的概念,再用规则把它们连起来。你看,麻烦来了。第一条和第三条一碰面,逻辑系统就开始冒汗。这也是符号主义 AI 的典型气质:它特别擅长处理规则清楚、边界明确的问题。像数学证明、棋类搜索、专家规则推理,都很适合它。它像一位严谨的图书管理员,每张卡片都放得整整齐齐。但现实世界偏偏不是图书馆。现实世界更像菜市场:吵、乱、有例外,还有人临时改需求。它的问题也很明显:规则要人写,例外太多时系统会越来越笨重。一句话总结:早期 AI 很会讲逻辑,但生活不总讲逻辑。二、专家系统:把老师傅装进机器里
到了 20 世纪 70 到 80 年代,AI 研究出现了一个很实用的方向:专家系统。专家系统的想法是:既然医生、工程师、金融专家有大量经验,那我们能不能把这些经验写成规则,让机器帮忙判断?如果出现症状 A 和症状 B,并且检测结果 C 为阳性,那么可能是疾病 X。这种系统在一些专业领域确实有过亮眼表现。因为在特定范围内,专家经验是能被规则化的。比如设备故障诊断、医学辅助判断、配置推荐等。但它也遇到一个很现实的问题:专家的知识并不总是能说清楚。老师傅修机器时可能看一眼、听一声,就知道哪里不对。你问他怎么判断的,他说:“感觉不对。”IF 老师傅感觉不对 THEN 赶紧检查。
专家系统后来遇到的一个瓶颈,就叫知识获取瓶颈:很多知识存在于人的经验、直觉和场景判断里,很难完整写成规则。这像是让一位厨师把“少许盐”“差不多熟了”“火候到了”全部精确成公式。厨师会沉默,锅也会沉默。三、ELIZA:机器第一次让人觉得“它懂我”
ELIZA 是 Joseph Weizenbaum 在 1960 年代开发的早期聊天程序。它最有名的版本模仿心理咨询师,会把用户的话稍微改写后抛回去。ELIZA 效应示意图熟悉吗?像不像某些会议里那位永远在说“我们再展开聊聊”的同事。ELIZA 的厉害之处,不在于它真的理解了你,而在于它用非常简单的模式匹配,让人产生了“它在理解我”的感觉。这后来被称为 ELIZA effect:人类很容易把理解、意图、情感投射到机器身上。这件事放到今天依然重要。大语言模型比 ELIZA 强大太多,但用户仍然需要记住一件事:这不是贬低 AI,而是提醒我们不要被流畅表达迷惑。一个回答很丝滑的系统,也可能只是错得很有礼貌。四、心智社会:智能也许不是一个“大脑”,而是一群“小助手”
后来,Marvin Minsky 提出了一个很有启发性的想法:智能并不一定来自一个单一的超级大脑,它可能来自很多小模块的协作。单独看,每个人能力都有限;合在一起,就能完成复杂任务。这个观点对今天的多智能体系统很有启发。现代 Agent 系统里,我们经常会看到类似分工:这也解释了为什么现在很多 Agent 框架喜欢模拟团队协作。复杂任务本来就不是一个“万能脑袋”能轻松搞定的,它更像一个流程,需要分工、反馈和协调。当然,多 Agent 也不是越多越好。三个 Agent 可能像团队协作,三十个 Agent 可能像群聊失控。每个人都在发表意见,最后没人交付结果。五、从写规则到学经验:机器学习改变了方向
符号主义和专家系统的共同特点是:很多知识要先由人类写进去。与其让人把规则全写出来,不如让机器从数据和反馈里自己学。其中,强化学习和 Agent 特别亲近。因为它天然就是一个“智能体和环境互动”的故事:强化学习闭环强化学习就是把这种“试一试、看结果、再改进”的过程数学化。AlphaGo 的成功,就是这一脉络的标志性事件之一。它让很多人意识到:机器不只是能按规则走,还能通过大量训练发现人类未必总结过的策略。但强化学习也有代价。它通常需要大量试错,而现实世界并不总允许你无限试错。投资系统里试错也不便宜,错一次可能财务总监血压上来。所以学习型智能体很强,但真正落地时必须考虑成本、安全和边界。六、大语言模型登场:Agent 终于有了通用“大脑”
过去很多 Agent 系统都很专用。下棋的会下棋,导航的会导航,诊断的会诊断。它们在自己的地盘很强,但换个场景就不一定能干活。大语言模型带来的变化是:它能理解自然语言,能处理上下文,能生成计划,还能和各种工具连接。现在我们可以给模型一个目标,让它拆解任务、调用工具、观察结果,再继续调整。现代 LLM Agent 技术栈“帮我整理一份 AI Agent 的入门文章,要适合普通读者,风格幽默一点,最后生成 Word 文档。”- 拆解任务:先找资料,再提纲,再写稿,再配图,再转格式。
现代 Agent 的关键,不只是大模型本身更聪明,而是它被放进了一个可以行动的系统里。所以,LLM Agent 不是“一个模型包打天下”。它更像一支小队:模型负责理解和推理,工具负责执行,记忆负责连续性,规则负责安全边界。七、历史给我们的几个提醒
从专家系统到现代 Agent,人们一直想让机器替人完成复杂任务。但越复杂的任务,越需要边界、验证和人工介入。全自动听起来很美,出错时也很刺激。现在大家都在聊大模型,但规则并没有过时。报销审批、权限控制、合规检查、风控阈值,这些地方规则依然很重要。一个可靠的系统,往往是规则和模型配合,而不是谁彻底取代谁。ELIZA 很早就证明,人类容易被对话感打动。今天的 LLM 更会表达,我们更要多看它是否能完成任务、是否有证据、是否能被检查。第四,Agent 的未来不是一个超级大脑独自表演。更可能是:模型、工具、工作流、记忆、评估、安全机制一起组成系统。真正有价值的不是“AI 很聪明”,而是“AI 能在正确边界内完成正确任务”。八、总结:Agent 的历史,其实是 AI 学会办事的历史
如果把 AI Agent 的发展压缩成一条线,可以这样理解:心智社会和多智能体思想提示我们:复杂智能可能来自分工协作。机器学习和强化学习让智能体能通过数据和反馈改进策略。大语言模型则把自然语言理解、规划和工具调用连接起来,让 Agent 进入大众视野。所以,今天的 Agent 不是某个单点技术突然爆炸,而是几十年 AI 思想的合流。它继承了符号主义的规则意识,借鉴了专家系统的领域知识,吸收了机器学习的经验改进,也依赖大语言模型的通用理解能力。AI Agent 的发展史,就是机器从“背规则”到“学经验”,再到“带着工具完成目标”的过程。它还没有变成电影里的全能助手,但已经从“只会回答问题”走向“能参与完成任务”。1. Datawhale,《Hello-Agents:从零开始构建智能体》在线阅读:https://hello-agents.datawhale.cc/#/./README2. Datawhale,第二章《智能体发展史》GitHub 源文档:https://github.com/datawhalechina/hello-agents/blob/main/docs/chapter2/%E7%AC%AC%E4%BA%8C%E7%AB%A0%20%E6%99%BA%E8%83%BD%E4%BD%93%E5%8F%91%E5%B1%95%E5%8F%B2.md3. Allen Newell, Herbert A. Simon, “Computer Science as Empirical Inquiry: Symbols and Search”:https://dl.acm.org/doi/10.1145/360018.3600224. Joseph Weizenbaum, “ELIZA, a computer program for the study of natural language communication between man and machine”:https://dl.acm.org/doi/10.1145/365153.3651685. Marvin Minsky, The Society of Mind:https://archive.org/details/societyofmind00mins6. David Silver et al., “Mastering the game of Go with deep neural networks and tree search”:https://www.nature.com/articles/nature16961