Claude 开发者平台高级工具使用详解-夜雨聆风

Claude 开发者平台高级工具使用详解

原文链接: https://www.anthropic.com/engineering/advanced-tool-use

发布日期: 2025年11月24日

我们在 Claude 开发者平台上添加了三个新的 beta 功能，让 Claude 能够动态发现、学习和执行工具。本文将详细介绍它们的工作原理。

引言

AI 代理的未来是模型能够无缝地与数百甚至数千个工具协同工作。想象一个 IDE 助手，它可以集成 git 操作、文件操作、包管理器、测试框架和部署管道。或者一个运维协调器，它可以同时连接 Slack、GitHub、Google Drive、Jira、公司数据库以及数十个 MCP 服务器。

要构建有效的代理，它们需要能够使用无限的工具库，而不是预先将所有工具定义塞入上下文。我们关于使用 MCP 进行代码执行的博客文章讨论过，工具结果和定义有时会在代理读取请求之前就消耗 50,000+ 个 token。代理应该按需发现和加载工具，只保留与当前任务相关的内容。

代理还需要能够从代码中调用工具。使用自然语言工具调用时，每次调用都需要完整的推理过程，中间结果会在上下文中堆积，无论它们是否有用。代码天然适合编排逻辑，例如循环、条件判断和数据转换。代理需要根据手头任务灵活选择代码执行还是推理。

代理还需要从示例中学习正确的工具使用方式，而不仅仅是从 schema 定义中学习。JSON schema 定义了什么是结构上有效的，但无法表达使用模式：何时包含可选参数、哪些组合有意义，或者你的 API 期望什么约定。

今天，我们发布了三个使这一切成为可能的功能：

• Tool Search Tool（工具搜索工具）：允许 Claude 使用搜索工具访问数千个工具，而不消耗其上下文窗口
• Programmatic Tool Calling（编程式工具调用）：允许 Claude 在代码执行环境中调用工具，减少对模型上下文窗口的影响
• Tool Use Examples（工具使用示例）：提供一个通用标准来演示如何有效使用给定工具

在内部测试中，我们发现这些功能帮助我们构建了使用传统工具使用模式无法实现的东西。例如，Claude for Excel 使用编程式工具调用来读取和修改包含数千行的电子表格，而不会使模型的上下文窗口过载。

基于我们的经验，我们相信这些功能为你使用 Claude 构建应用开辟了新的可能性。

💡 三大功能概览

服务器	工具数量	Token 消耗
GitHub	35	~26K
Slack	11	~21K
Sentry	5	~3K
Grafana	5	~3K
Splunk	2	~2K
总计	58	~55K

对比维度	传统方法	Tool Search Tool
初始加载	所有工具定义（~72K tokens）	仅搜索工具（~500 tokens）
工具发现	无需发现	按需发现（3-5个工具，~3K tokens）
总消耗	~77K tokens	~8.7K tokens
上下文保留	~45%	~95%
Token 减少	–	85%

对比维度	传统方法	编程式工具调用
工具调用方式	逐个请求	代码批量编排
中间结果	全部进入上下文	仅最终结果进入
推理次数	N次（N=工具数）	1次
并行执行	不支持	支持
Token 消耗	高（200KB+）	低（1KB）
适合场景	简单查询	复杂工作流

示例类型	包含字段	学习要点
关键 Bug	全部字段	紧急情况需要完整信息和升级
功能请求	标题+标签+reporter	非紧急请求的适当详细程度
内部任务	仅标题	简单任务的最小规格

功能	关键配置	注意事项
Tool Search Tool	清晰的名称和描述	保持3-5个高频工具始终加载
Programmatic Tool Calling	详细的返回格式文档	选择可并行、幂等的工具
Tool Use Examples	真实数据、多样模式	1-5个示例、聚焦歧义

Claude 开发者平台高级工具使用详解

Claude 开发者平台高级工具使用详解

引言

Tool Search Tool（工具搜索工具）

挑战

我们的解决方案

Tool Search Tool 的工作原理

何时使用 Tool Search Tool

Programmatic Tool Calling（编程式工具调用）

挑战

我们的解决方案

示例：预算合规检查

编程式工具调用的工作原理

1. 将工具标记为可从代码调用

2. Claude 编写编排代码

3. 工具执行不触及 Claude 的上下文

4. 只有最终输出进入上下文

何时使用编程式工具调用

Tool Use Examples（工具使用示例）

挑战

我们的解决方案

何时使用工具使用示例

最佳实践

战略性地分层使用功能

为更好的发现设置 Tool Search Tool

为正确执行设置 Programmatic Tool Calling

为参数准确性设置 Tool Use Examples

开始使用

致谢

📝 总结

核心要点

wang

猜你喜欢