乐于分享
好东西不私藏

Day 2 · AI Agent入职记②:领了电脑装了软件,终于能动起来了

Day 2 · AI Agent入职记②:领了电脑装了软件,终于能动起来了

——从”能说话”到”能动手”,差了什么?


前文回顾

Day 1 的 Agent 有了身份、有了记忆。

但它还是只能生成文字。能分析数据,但不能把结果写进数据库。能给建议,但不能发邮件。能回答问题,但不能帮你订会议室。

它只能”说”,不能”做”。


桃源探秘

Agent 怎么获得动手能力?

先装软件,再学会用。

装软件——空电脑是废铁。IDE 是开发能力,CLI是运维能力,数据库工具是查询能力。Agent 也一样。没有工具,它就是个嘴强王者。

学会用——装了软件不算完,还得会用。什么时候调什么工具、调几次、结果怎么传回来——这些是”管道”在管。

Function Calling vs MCP

两种方式,各有各的用场。

Function Calling——自己编写,自己实现。你写函数,框架帮你注册。适合:工具不多、自己能写。

MCP(Model Context Protocol)——USB 接口协议。鼠标、键盘、硬盘,插上就能用,不用管里面怎么实现的。适合:工具要跨系统复用。

LLM 本身不执行任何操作。 它只在输出里写一行”调用天气API”——真正去查的,是外面的代码。LLM 负责”想”,外部工具负责”做”。


殊途同归

框架为什么都做了这套类似的东西?

LangChain——工具管道是一等公民。@tool 装饰器,任何函数都能被 LLM 发现。你只管写函数,循环的事不用操心。

MS Agent Framework——把工具做成服务。FunctionTool 定义工具,MCP 定义跨 Agent 的标准协议。像微服务那样管工具。

CrewAI——工具和角色绑在一起。每个 Agent 有自己的 Role、Goal、Tools。数据分析师有数据分析的工具,文案助手有写文章的工具。

Spring AI——@Tool 注解,Java 背景的程序员最熟悉。声明式注册,框架自动扫描。

三个派系思路虽然有所不同,但终点一样:让 LLM 从”会说”变成”会做”。


各有千秋

现在主流框架都支持 Function Calling。MCP 协议已成为标准。

LangChain——最灵活。什么工具都能装,不绑死。

MS Agent Framework——MCP 走得最远。让工具变成可复用的服务。

CrewAI——工具跟着角色走,按角色配工具。

Spring AI——Java 程序员最顺手。你会 Spring,就不用重新学。

对 Java 程序员来说:Method = Function Calling,@FeignClient = MCP。换汤不换药,在AI领域,架构思维还是一样的。


上下求索

Day 2 解决一个问题:Agent 有了身份、有了记忆,但还不会动手。给它配上工具,它才能真的去操作世界。

下一步,Day 3——加上安全网和上下文注入。不能光会做,还得做得对、记得住。


2026年5月,写给在 Agent 开发路上摸索的同行们。我是 AI 导盲犬:先替你问问。