AI Agent三大底层概念,买菜就懂

很多人一上来就想搭Agent，结果折腾半天，连Agent到底是什么都没搞清楚。

今天用去菜市场买菜这个例子，把AI Agent最核心的三个底层概念讲透。
看完你就能判断：一个Agent到底靠不靠谱。

— 正文开始 —

一、先搞清楚：AI Agent和普通AI有啥区别？

很多人把ChatGPT当成Agent，其实差远了。

普通AI（大模型）= 一个很会聊天的朋友
你问它"今天吃什么"，它能给你建议。但它只能动嘴，不能动手。

AI Agent = 一个能帮你干活的管家
你说"帮我做个晚餐"，它会自己去查冰箱有什么菜、看菜谱、下单买缺的菜、最后把饭做好。

金句①：大模型是"嘴强王者"，Agent才是"干活的人"。
能动手的AI才叫Agent，只能动嘴的叫聊天机器人。

二、概念一：工具调用（Tool Use）—— Agent的"手"

用买菜来理解

你去菜市场买菜，需要：
- 拿钱包付钱
- 用手机看菜谱
- 拿环保袋装菜

这些"工具"你从小就会用，所以不觉得有什么。

但对AI来说，能用工具是一个巨大的飞跃。

技术上怎么理解？

工具调用（Tool Use / Function Calling）就是：
AI不仅能生成文字，还能调用外部程序来做事。

比如：
- 调用搜索引擎查最新信息
- 调用数据库查公司数据
- 调用API发邮件、创建工单
- 调用代码执行器跑Python脚本

# 一个最简单的工具调用示例
tools = [{
  "name": "get_weather",
  "description": "查天气",
  "parameters": {"city": "城市名"}
}]

# AI看到用户问"北京今天天气怎样"
# 它不会瞎编，而是调用 get_weather(city="北京")
# 拿到真实数据后再回答

关键判断标准：一个好的Agent，手里的"工具"越多越实用。
如果一个Agent只会聊天不会用工具，那就是个花架子。

三、概念二：记忆（Memory）—— Agent的"脑子"

用买菜来理解

你第二次去菜市场，老板说：
"上次你买了3斤排骨，这次要不要再来点？"

你记得：
- 上次买的排骨太肥了，这次要瘦的
- 家里酱油快没了，顺便买一瓶
- 老公不吃香菜，别买

这就是记忆的作用。没有记忆，每次对话都是一张白纸。

技术上怎么理解？

Agent的记忆分两种：

短期记忆 = 当前对话的上下文
就像你跟老板讨价还价时记得"刚才他说最低15块"

长期记忆 = 跨对话的持久化信息
就像你记得"这个老板总是短斤少两，要用公平秤"

# 短期记忆：对话历史
messages = [
  {"role": "user", "content": "我要做一个番茄炒蛋"},
  {"role": "assistant", "content": "好的，需要3个番茄..."},
  {"role": "user", "content": "改成2个就行"}
]

# 长期记忆：向量数据库存储
# 用户偏好 → "不喜欢太甜的菜" → 存入向量库
# 下次做饭时检索出来，自动调整菜谱

金句②：没有记忆的Agent，就像每天失忆的管家——
今天你告诉他不吃香菜，明天他又给你放了香菜。
记忆能力决定了Agent是"一次性工具"还是"长期搭档"。

四、概念三：规划（Planning）—— Agent的"脑子转"

用买菜来理解

你说："今晚请朋友吃饭，做四菜一汤，预算200块。"

一个没规划能力的人：
看到什么买什么，最后要么超预算，要么菜凑不齐。

一个有规划能力的人：
先想菜单 → 再列清单 → 算预算 → 去菜场按清单买 → 回来按顺序做菜。

这就是规划能力的差距。

技术上怎么理解？

规划（Planning）是Agent最核心的能力：
把一个大任务拆成小步骤，按顺序执行，遇到问题还能调整。

常见实现方式：

① ReAct 模式（思考→行动→观察→再思考）
就像做菜时尝一口、调一下味道、再尝。

② 任务分解（大任务拆小任务）
"做四菜一汤" → "先做番茄炒蛋" → "再做清蒸鱼" → ...

# 任务分解示例
goal = "帮我写一份周报"

# Agent自动拆解为：
steps = [
  "1. 查看本周日历，列出完成的事项",
  "2. 查看本周的代码提交记录",
  "3. 整理遇到的问题和解决方案",
  "4. 按模板格式生成周报",
  "5. 发送给主管审批"
]

# 然后按顺序执行每一步

关键判断：看一个Agent有没有规划能力，就看它能不能：
① 把大任务拆成小步骤
② 遇到错误能调整方案
③ 执行过程中能自我检查

金句③：工具是Agent的手，记忆是Agent的笔记本，规划才是Agent的脑子。
三样缺一样，Agent就是个半成品。

五、三个概念合在一起：一个完整的买菜Agent

现在把三个概念串起来，看看一个"买菜Agent"怎么运作：

用户需求："今晚请朋友吃饭，做四菜一汤"

【规划】Agent思考：
→ 菜单：番茄炒蛋、清蒸鱼、蒜蓉西兰花、红烧排骨、紫菜蛋花汤
→ 需要哪些食材？家里有什么？缺什么？
→ 预算多少？去哪个菜市场？

【记忆】Agent回忆：
→ 上次朋友说不吃辣，这次不放辣椒
→ 家里冰箱还有鸡蛋和西兰花
→ 菜市场东边那家鱼新鲜

【工具调用】Agent执行：
→ 调用"查冰箱"工具 → 发现有鸡蛋、西兰花
→ 调用"算价格"工具 → 排骨35+鱼40+番茄10+调料15=100，在预算内
→ 调用"下单"工具 → 去菜市场按清单购买
→ 调用"做菜"工具 → 按菜谱依次制作

六、怎么判断一个Agent靠不靠谱？

记住这3个判断标准：

✅ 有工具 —— 能不能调用外部程序帮你做事？
只会聊天的Agent = 只会动嘴的厨师

✅ 有记忆 —— 能不能记住你的偏好和历史？
没有记忆的Agent = 每天失忆的管家

✅ 有规划 —— 能不能把大任务拆成小步骤？
没有规划的Agent = 做菜不看菜谱的新手

金句④：下次再有人跟你吹"我们这个AI Agent很强"，
你就问三个问题：
① 它能调用什么工具？
② 它有记忆能力吗？
③ 它能把复杂任务拆成步骤吗？
答不上来的，就是个套壳聊天机器人。

七、避坑指南：新手最容易犯的3个错

❌ 坑1：把"能聊天"当"能干活"
很多Agent只是套了个GPT的壳，连API都不会调。
解法：看它能不能实际执行操作（查数据、发消息、写文件）

❌ 坑2：忽略记忆能力
没有记忆的Agent，每次对话都是从零开始。
解法：看它能不能记住你的偏好、历史对话、之前的决策

❌ 坑3：高估规划能力
有的Agent号称能规划，但拆出来的步骤一塌糊涂。
解法：给它一个稍微复杂点的任务（如"帮我安排明天的会议"），看它拆解得是否合理

避坑口诀：
工具不全的别用——干活得有趁手的家伙
没有记忆的慎用——每次重来的体验太差
规划不行的少用——复杂任务它搞不定

八、下一步：动手搭一个真正能干活的Agent

搞懂了这三个概念，你就有了判断Agent好坏的"火眼金睛"。

下一期我会手把手带你搭一个真正能干活的Agent：
- 用MCP协议给它接上真实工具
- 用向量数据库给它加上记忆
- 用ReAct模式让它学会规划

从"嘴强王者"变成"干活达人"，就差这一步。

👇 关注我，下期教你搭一个真正能干活的AI Agent
点赞+在看，让更多人看到这篇干货