AI Agent 每次调用烧钱?这10个技巧帮你节省98%的Token
介绍了 10 种降低 Token 消耗的技术,最高达 98%,同时带来更快速度和更高准确率。
核心思路:渐进式信息披露(Progressive Disclosure)——不要把所有工具一次性加载进上下文,而是按需、分层、动态地加载。
最重要的三种方法:
1. 代码执行模式:Agent 将 MCP Server 视为文件系统,按需读取工具文件,中间结果不进入上下文,节省 98%
2. 工具搜索Tool Search:类似 RAG,Agent 用自然语言搜索需要的工具,动态加载——55,000 tokens 可减少 85% 以上
3. 分组加载(Scope Loading):按任务场景将工具分组,只加载当前任务所需的组
夜雨聆风