AI 每日一课 | 第 14 期
上一期聊了 RAG——让 AI 带着文档回答问题。但 RAG 只解决了「知道更多」,AI 还是只能输出文字。今天聊一个更大的跃迁:让 AI 不只是说,还能做。
Kiro 帮你改 bug:读文件→改代码→跑测试→提交。Camus 执行 Skill:调 API→查数据库→生成报告。这些都是行动,不是聊天。这就是 Agent。
从聊天到干活
聊天机器人:只能输出文字。问天气说「我无法获取实时信息」。
工具调用:能调外部函数。问天气→调天气API→返回真实数据。
Agent:自主规划+多步执行。说「帮我规划行程」→查天气→查日历→查交通→综合输出。
Function Calling:模型学会调函数
1. 告诉模型有哪些工具可用(函数名+参数描述)
2. 模型判断是否需要调用工具
3. 模型输出结构化调用请求(函数名+参数值)
4. 外部系统执行函数,返回结果
5. 模型基于结果生成最终回答
关键:模型本身不执行任何函数。它只决定「调什么」和「传什么参数」。模型是大脑,工具是手脚。
MCP:工具调用的标准协议
MCP(Model Context Protocol)是 Anthropic 提出的标准化协议,让工具接入变得统一。
标准化:一次实现,所有支持 MCP 的模型都能用
解耦:工具开发和模型开发分离,各自迭代
安全:统一的权限控制和审批机制
你在 Kiro 里用的 Camus MCP 工具(upload_wiki、run_skill 等),就是通过 MCP 协议接入的。
Agent:自主规划 + 多步执行
ReAct 模式
Thought(思考)→ Action(行动)→ Observation(观察结果)→ 循环,直到可以给出最终答案。
Agent 的核心能力
• 规划:把复杂任务拆解成多个步骤
• 工具选择:从可用工具中选择合适的
• 反思:根据结果判断下一步
• 纠错:发现错误时调整策略
Agent 的挑战
规划有限:1-3步简单规划没问题,10步以上容易出错
执行可能失败:网络超时、API报错、权限不足
安全风险:能执行真实操作(删文件、改数据库),规划错误后果不可逆
成本高:多步执行意味着多次模型调用,Token消耗是单次的10倍+
今日要点
1. Agent = 自主规划 + 工具调用 + 多步执行,从聊天进化到干活
2. Function Calling:模型决定调什么,外部系统负责执行
3. MCP 是工具调用的标准协议,一次实现所有模型都能用
4. ReAct 模式:Thought→Action→Observation 循环
5. Agent 挑战:规划有限、执行可能失败、安全风险、成本高
6. 你的 Camus+Kiro 工作流就是一个人机协作的 Agent 系统
AI 从「能说」到「能做」,是从语言模型到 Agent 的跃迁。但「能做」也意味着「能做错」。Agent 的核心不只是能力,还有边界——知道什么该做、什么不该做、什么时候该停下来问人。
明天第 15 期,我们聊思维链与推理——AI 怎么学会「想一想再回答」?为什么让模型展示推理过程,准确率就能大幅提升?
明天见。
夜雨聆风