AI 智能体(AI Agent) | 城市轨道交通专业术语解释(74)

★AI 智能体（AI Agent）

AI 智能体（AI Agent）是一个具备感知环境、自主决策、并采取行动以达成特定目标的智能实体。能够基于目标自主决策、规划步骤、执行动作，并在过程中根据环境反馈进行调整，减少人工干预。通常，AI Agent 由感知模块、认知与决策模块和行动模块组成。

1.记忆与状态

这是智能体区别于无状态 API 调用的根本。它包含：

短期记忆：维持当前对话上下文的连贯性，记住刚刚发生的事。

长期记忆：依赖外部向量数据库，持久化存储用户偏好、历史知识，实现跨会话的个性化体验。

2.规划与推理

这是智能体的思维中枢。当接收到“策划一次旅行”这样的模糊指令时，智能体不会直接输出结果，而是进行任务分解。它会利用思维链或树状思维图，将大目标拆解为“查询机票、预订酒店、规划路线”等子任务，并预判可能的错误，形成可执行的动作序列。

3.工具使用

这是智能体超越纯语言模型的行动力体现。智能体懂得何时、以及如何调用外部工具。这些工具包括但不限于：

API 调用：连接天气服务、股票数据。

代码解释器：运行代码处理数据、绘制图表。

联网搜索：获取实时信息，破除模型的知识截止限制。应用程序操作：在 RPA 场景中，直接操控鼠标键盘。

4.行动与观察

智能体执行动作后，会严格观察反馈结果。如果调用的机票 API 返回“查无此航班”，它会根据这个观察结果启动自我纠错，调整参数重新搜索，或转而查询相近日期，而非一条道走到黑，最终循环直至目标达成。

关键变体与应用

单智能体：全能型个体，内置完备工具集，独立闭环。代表产品如OpenAI 的Deep Research。

多智能体系统：模拟社会组织，每个智能体扮演特定角色（如CEO、程序员、质检员），通过相互协作、辩论甚至博弈，来解决“编写一个完整软件”这类单体难以为继的庞杂任务。

前沿观察

当前，AI 智能体正从“好玩”走向“好用”。MCP 协议的出现，正试图为智能体建立一套连接万物的“USB 接口标准”，让信息孤岛间的协同成为可能。同时，浏览器智能体的兴起，使得AI 可以直接像人类一样理解并操作网页，是实现自动化办公的关键一步。

尽管自主决策带来的安全风险和复杂推理的可靠性仍是挑战，但AI 智能体的演进方向已然清晰：它正将AI 从只能“聊天”的鹦鹉，进化为能够“办事”的实干家。

供稿：韩德志

北京城建设计发展集团技术研究院数字信息技术中心

城市轨道交通网CCRM

专注城轨领域