Day 2 · AI Agent入职记②:领了电脑装了软件,终于能动起来了
——从”能说话”到”能动手”,差了什么?

前文回顾
Day 1 的 Agent 有了身份、有了记忆。
但它还是只能生成文字。能分析数据,但不能把结果写进数据库。能给建议,但不能发邮件。能回答问题,但不能帮你订会议室。
它只能”说”,不能”做”。
桃源探秘
Agent 怎么获得动手能力?
先装软件,再学会用。
装软件——空电脑是废铁。IDE 是开发能力,CLI是运维能力,数据库工具是查询能力。Agent 也一样。没有工具,它就是个嘴强王者。
学会用——装了软件不算完,还得会用。什么时候调什么工具、调几次、结果怎么传回来——这些是”管道”在管。
Function Calling vs MCP
两种方式,各有各的用场。
Function Calling——自己编写,自己实现。你写函数,框架帮你注册。适合:工具不多、自己能写。
MCP(Model Context Protocol)——USB 接口协议。鼠标、键盘、硬盘,插上就能用,不用管里面怎么实现的。适合:工具要跨系统复用。
LLM 本身不执行任何操作。 它只在输出里写一行”调用天气API”——真正去查的,是外面的代码。LLM 负责”想”,外部工具负责”做”。
殊途同归
框架为什么都做了这套类似的东西?
LangChain——工具管道是一等公民。@tool 装饰器,任何函数都能被 LLM 发现。你只管写函数,循环的事不用操心。
MS Agent Framework——把工具做成服务。FunctionTool 定义工具,MCP 定义跨 Agent 的标准协议。像微服务那样管工具。
CrewAI——工具和角色绑在一起。每个 Agent 有自己的 Role、Goal、Tools。数据分析师有数据分析的工具,文案助手有写文章的工具。
Spring AI——@Tool 注解,Java 背景的程序员最熟悉。声明式注册,框架自动扫描。
三个派系思路虽然有所不同,但终点一样:让 LLM 从”会说”变成”会做”。
各有千秋
现在主流框架都支持 Function Calling。MCP 协议已成为标准。
LangChain——最灵活。什么工具都能装,不绑死。
MS Agent Framework——MCP 走得最远。让工具变成可复用的服务。
CrewAI——工具跟着角色走,按角色配工具。
Spring AI——Java 程序员最顺手。你会 Spring,就不用重新学。
对 Java 程序员来说:Method = Function Calling,@FeignClient = MCP。换汤不换药,在AI领域,架构思维还是一样的。
上下求索
Day 2 解决一个问题:Agent 有了身份、有了记忆,但还不会动手。给它配上工具,它才能真的去操作世界。
下一步,Day 3——加上安全网和上下文注入。不能光会做,还得做得对、记得住。

2026年5月,写给在 Agent 开发路上摸索的同行们。我是 AI 导盲犬:先替你问问。
夜雨聆风