AI 每日一课 #14:Agent 与工具调用——AI 怎么从聊天进化到干活

AI 每日一课 | 第 14 期

上一期聊了 RAG——让 AI 带着文档回答问题。但 RAG 只解决了「知道更多」，AI 还是只能输出文字。今天聊一个更大的跃迁：让 AI 不只是说，还能做。

Kiro 帮你改 bug：读文件→改代码→跑测试→提交。Camus 执行 Skill：调 API→查数据库→生成报告。这些都是行动，不是聊天。这就是 Agent。

从聊天到干活

聊天机器人：只能输出文字。问天气说「我无法获取实时信息」。

工具调用：能调外部函数。问天气→调天气API→返回真实数据。

Agent：自主规划+多步执行。说「帮我规划行程」→查天气→查日历→查交通→综合输出。

1. 告诉模型有哪些工具可用（函数名+参数描述）

2. 模型判断是否需要调用工具

3. 模型输出结构化调用请求（函数名+参数值）

4. 外部系统执行函数，返回结果

5. 模型基于结果生成最终回答

关键：模型本身不执行任何函数。它只决定「调什么」和「传什么参数」。模型是大脑，工具是手脚。

MCP（Model Context Protocol）是 Anthropic 提出的标准化协议，让工具接入变得统一。

标准化：一次实现，所有支持 MCP 的模型都能用

解耦：工具开发和模型开发分离，各自迭代

安全：统一的权限控制和审批机制

你在 Kiro 里用的 Camus MCP 工具（upload_wiki、run_skill 等），就是通过 MCP 协议接入的。

Thought（思考）→ Action（行动）→ Observation（观察结果）→ 循环，直到可以给出最终答案。

• 规划：把复杂任务拆解成多个步骤

• 工具选择：从可用工具中选择合适的

• 反思：根据结果判断下一步

• 纠错：发现错误时调整策略

规划有限：1-3步简单规划没问题，10步以上容易出错

执行可能失败：网络超时、API报错、权限不足

安全风险：能执行真实操作（删文件、改数据库），规划错误后果不可逆

成本高：多步执行意味着多次模型调用，Token消耗是单次的10倍+

1. Agent = 自主规划 + 工具调用 + 多步执行，从聊天进化到干活

2. Function Calling：模型决定调什么，外部系统负责执行

3. MCP 是工具调用的标准协议，一次实现所有模型都能用

4. ReAct 模式：Thought→Action→Observation 循环

5. Agent 挑战：规划有限、执行可能失败、安全风险、成本高

6. 你的 Camus+Kiro 工作流就是一个人机协作的 Agent 系统

AI 从「能说」到「能做」，是从语言模型到 Agent 的跃迁。但「能做」也意味着「能做错」。Agent 的核心不只是能力，还有边界——知道什么该做、什么不该做、什么时候该停下来问人。

明天第 15 期，我们聊思维链与推理——AI 怎么学会「想一想再回答」？为什么让模型展示推理过程，准确率就能大幅提升？

明天见。