这不是科幻。从你家墙上那个不起眼的恒温器,到能感知路况的自动驾驶汽车,再到今天由大语言模型驱动的AI助手,它们都属于同一个技术家族——智能体(Agent)。
这篇文章,我想带你系统性地走一遍智能体的演进脉络、核心原理和工程落地逻辑。不管你是刚入门还是已经在做相关开发,希望看完都能对“Agent”这个词有更踏实的理解。
先给个最核心的定义:智能体是一个能通过传感器感知环境,并自主地通过执行器采取行动,以达成某个目标的实体。
换句话说,它不是一个被动等待指令的程序,而是一个有“感知-思考-行动”闭环的独立个体。

你可以把它想象成一个自动驾驶汽车的司机:它的“眼睛和耳朵”是摄像头、雷达(传感器),用来观察路况;它的“手和脚”是方向盘、油门、刹车(执行器),用来改变车辆状态;而它置身其中的马路、车流、行人,就是它需要应对的“环境”。
理解智能体,我们得先拆开看它的四个基本构成要素:环境、传感器、执行器,以及最关键的——自主性。自主性意味着它不需要人类一步一步告诉它该干什么,它能自己决定下一步动作。
在LLM出现之前,智能体已经走过了几十年的演进。这条脉络很清晰,一共可以分成五个阶段,而且每个阶段都在解决前一个阶段的短板。

- 反射智能体(最简单形态)
基于“条件-动作”规则,对当前感知做出即时反应。典型例子:恒温器。看到红灯就刹车,灯绿就油门,不记过去不预测未来。 - 基于模型的反射智能体
内部维护了一个“世界模型”,用来追踪看不见但对决策至关重要的信息,例如隧道里的自动驾驶汽车不会因短暂失明猛打方向盘。 - 基于目标的智能体
能主动规划一系列动作实现未来目标,最直观的是GPS导航系统,自动规划最优路径。 - 基于效用的智能体
给每个可能结果打分(效用),选择最高满意度的方案。例如在最快、最省电、最低价之间做权衡。 - 学习型智能体
通过与环境试错,自己总结策略。AlphaGo Zero没背人类棋谱,自己下了几千万盘成为顶级棋手。
传统智能体能力边界受限于人类设计规则。而大语言模型驱动的智能体,彻底打破天花板。LLM通过海量文本预训练获得隐式的世界知识和通用推理能力,能理解模糊高层意图并自主拆解步骤。
例如:你告诉LLM智能体“帮我规划一个风景好、不堵车的周末兜风路线”,它能自动分解成:搜索风景点 → 查询实时路况 → 设定途经点 → 生成导航路线,并调用地图API去执行。
LLM智能体的核心工作流程,可以归结为三步循环:规划与推理 → 工具使用 → 动态修正。
- 反应式智能体
:求快,不思考未来,适合高频交易等实时场景。 - 规划式智能体
:求优,深度搜索全局最优,适合下棋、物流调度。 - 混合式智能体
:平衡两者,通过“思考-行动-观察”循环,把大目标拆成可随时修正的微步骤,最接近人类思维方式。LLM智能体天然适合混合式路线。
- 符号主义AI
:逻辑规则透明,但规则外场景会失效,如早期专家系统。 - 亚符号主义AI
:神经网络通过数据悟出模式,擅长模糊识别,但决策黑箱。 - 神经符号主义AI
:融合“快直觉”与“慢思考”,被认为是通向通用人工智能的重要路径。
工程师搭建智能体之前,需要明确四个维度:性能度量、环境、执行器、传感器。以下以自动驾驶为例:
| P (性能度量) | |
| E (环境) | |
| A (执行器) | |
| S (传感器) |
现实世界的任务环境往往部分可观察、随机性高、动态且序贯,这推动了更智能的架构设计。
不论多复杂的智能体,都离不开这四步循环。工程实践中,“思考”和“行动”常被格式化成结构化文本。一个典型的LLM智能体日志序列如下:
Thought: 我现在需要知道用户的地理位置,才能搜索附近的景点。 Action: 调用地图API的获取当前位置功能。 Observation: 返回坐标(39.9, 116.4)……然后基于Observation进入下一轮Thought,如此往复,直到任务完成。
从工程角度看,搭建一个LLM智能体的关键核心在于做好两件事:
- 指令模板设计
:通过精心设计的Prompt,让LLM明白角色、任务、可用工具以及必须遵循的“思考-行动-观察”文本格式,相当于为LLM创建稳定运行的操作系统。 - 外部工具定义
:把外部API(搜索、代码解释器、数据库查询等)封装成LLM能“看懂”和调用的工具描述,当LLM输出Action指令时,工程代码拦截执行,并将结果作为Observation返回。

目前LLM智能体主要有两种落地形态:
- 嵌在工作流中的开发者工具
:如编程助手Copilot,实时给出建议,人机协作增强模式。 - 作为独立交付成果的自主协作者
:多智能体团队(模拟产品经理、工程师)自动完成需求、设计、开发、测试等,智能体是独立拿结果的“同事”。
需注意:Workflow(工作流)和Agent(智能体)不是一回事。Workflow是既定死路径;Agent则能动态规划,根据环境变化灵活决定如何达成目标。
从基于简单“条件-动作”规则的恒温器,到能自我对弈学习的AlphaGo Zero,再到今天能理解模糊指令、自主规划执行的大语言模型智能体,这个技术族谱验证了一件事:“智能”的本质,不是知道得更多,而是能更灵活地在不确定的世界里达成目标。
理解智能体,不只是理解一项技术,更是理解未来软件的一种全新形态——从“被操作的工具”到“自主拿结果的协作者”。这个转变,正在发生。
© 智能体技术专栏 · 查看下方阅读原文持续输出AI深度干货
夜雨聆风