AI Agent 认知感知

简单来说，大模型是AI的“大脑”，而AI Agent则是拥有“大脑+手脚”的完整实体-。它不仅能思考和推理，还能自主调用工具、执行操作来完成一个具体的目标。

核心公式：AI Agent = 大模型 + 记忆 + 规划 + 工具使用 + 行动能力-
关键架构：你需要先了解几个基础模式，ReAct（Reason+Act）模式 是最重要的一个。它让 Agent 通过推理→行动→观察的循环，按步骤解决问题-。可以把它想象成一个严谨的工程师：先想清楚（Thought），然后动手做（Action），再看结果决定下一步（Observation）。
能力分级：Google 提出了 Agent 的5级能力分级（从Level 0到 Level 4），这能帮你评估一个Agent的自主程度。目前大多数应用处于Level 2（能进行长期规划的策略性解决问题者）到Level 3（多Agent协作）之间

核心模型：AI Agent的五大组件

你可以这样理解：

这一模型是整个学习体系的中枢。以下四个技能维度，正是围绕它渐次展开。

Agent之所以区别于传统RAG或聊天机器人，核心在于它能够主动推理：什么时候该查资料，什么时候该追问，什么时候该承认失败。

关键学习点包括：

📌 实践建议：从“写一个能解数学应用题的Agent”开始，让它显式输出推理过程，并对比有无推理链的成功率。

真实任务很少是单轮对话：Agent需要记住用户偏好、任务状态、历史行动结果。

记忆分为两个层面-：

📌 实践进阶：从基础的RAG问答开始，逐步过渡到状态持久化——利用Redis或数据库保存Agent工作状态，实现“断点续传”-。

LLM本身无法查数据库、发邮件、操作浏览器——这些能力依赖工具调用。

核心学习内容--：

📌 实践场景：构建一个“个人旅行规划Agent”——它能调用航班API、天气API、地图工具，并自动汇总行程单。

当一个Agent能力不足时，专业分工的多Agent系统（MAS）成为必然--。

你需要学习：

📌 进阶项目：构建“代码开发团队”——一个Agent写代码，一个做代码审查，一个执行测试，经理Agent汇总结果。