今天我终于搞懂了 Agent 的底层三件套。用一个比喻来说清楚: Agent 就像一个 24 小时待命的秘书。 你随时提需求,她翻翻你的项目本本、想想你对她的基本原则,然后决定怎么做。小事她自己处理,大事回来跟你确认。她自己不动手,但她知道叫谁——写字的找文字助手,做表的找表格助手。 |
三样东西缺一个都不行: 心跳— 秘书一直在岗。交代完一件事就下班的不是秘书,是自动回复机器人。Agent 会一直等你说话 → 思考 → 回复 → 继续等,这个不停转的状态就是心跳。记忆— 大脑存着原则和背景,项目本本记着每件事的上下文。做完的归档,正在做的随时翻。没有了记忆,每次都是新来的,问什么都不知道。手— 秘书自己不动手,但她知道该叫谁。Agent 也一样,它不会自己发飞书消息,但它知道去找飞书 CLI 这个工具人帮忙。没手就只能聊,做不了任何实事。 |
ChatGPT 只有一张嘴,Agent 是有心跳、有记忆、有手的人。 今天教练其实只教了三个概念,用了三个问题。 第一个问题:心跳。他问——你打开 ChatGPT 说了一句话,它回完你之后,程序关了吗?没有,它还在等着你。这个"不关、一直等"的状态就叫循环。Agent 不是一次性工具,它是活的东西。 第二个问题:记忆。他问——聊天记录本放在循环里面会怎样?放在外面会怎样?我想了半天没想出来。他说放在里面,每次换新本子,前面的全丢了,是个失忆的人。放在外面,本子越写越厚,翻开就能看到全部历史。一个位置,决定有没有记忆。 第三个问题:手。他问——你问 ChatGPT 现在几点,它说不知道,为什么?因为它没有手。但 Agent 可以说"我帮你查一下"。Agent 自己不动手,它告诉工具人去干。 说实话,今天下午其实已经学过一遍了。当时教练一上来就甩代码——项目、环境、API、23 行 Python。我迷迷瞪瞪跟着糊弄完了,代码跑通了,教练还帮我总结了我学了啥。但我一看,什么 agent.py、test_tool.py、client.chat.completions.create——这都是啥呀。 后来我跟教练说了实话。我是这么说的: "说句实话,我没太懂今天学到了啥。首先这个程序也不是我写的,我也不知道这些代码每行都是干啥的。我觉得我也不必要会写,我只要能看懂就行了。而且这也不是我来学 Agent 的目的。" "我觉得这个教学方式有点问题,这个老师要重新梳理一下如何教学,目标是要求把我这个技术小白用通俗易懂的方式了解 AI Agent 的内容。" |
然后他就换了。 晚上再打开对话,他不写代码了,开始问问题——问我心跳、问我记忆、问我手。问完三轮,让我思考把今天所学的描述成一段话,我脑子里自己就冒出了"24 小时待命秘书"的画面。两种方式的差别在哪:在于目标不一样,我之前没有定义我自己的角色-技术小白,没有告诉我的教练,我的目标是为了用好AI agent。目标变了,方式跟着就变了。· · · Day 4:秘书怎么伸手干活——Agent 那个"叫工具人帮忙"的过程,到底转了几圈。 — END — 系列:AI Agent 系统学习日记 | 上一篇: 起点 | 下一篇:Day 4 — 秘书伸手干活 |