做AI应用开发的朋友,最近都在吐槽同一件事:
MCP服务器装多了,Claude/GPT4o直接罢工。
不是模型变笨了,是Prompt里塞的tool schema太多了,一次全塞进去,context直接爆掉。
这个问题,Nous Research的新版本Hermes Agent给出了一套解法。
Hermes Agent:不是更大的模型,是更聪明的调用方式
Hermes Agent这次更新的功能叫Tool Search,核心逻辑一句话:
不是把所有工具的说明一口气全塞给模型,而是按需渐进式披露——模型先用BM25算法在已知的工具库里检索,找到可能用得上的,再把对应的schema告诉模型。
说人话就是:你要用哪把刀,我再给你这把刀的说明书,而不是把整个工具箱翻个底朝天给你看。
Anthropic的评测数据很有意思:
用Opus 4测试,MCP工具调用准确率从49%提升到了74%。这个幅度在企业级场景里已经相当可观了。

为什么这件事值得关注
MCP(Model Context Protocol)本身是个好想法——让AI模型能调用各种外部工具。
但实际用起来,企业动不动就接十几个、几十个MCP服务,每个服务都有自己的工具描述。
传统做法是把所有工具schema一次性塞给模型上下文。模型确实能看到了,但上下文窗口吃紧,调用准确率反而下降。
这就像让一个人同时记住20个项目的所有细节,结果哪个都记不清楚。
Tool Search的思路本质上是把信息检索的任务先于推理完成——模型还没开始"想"之前,就先用BM25找好可能用得上的工具,再让模型做决策。
目前的状态
Tool Search功能已经集成进 Hermes Agent,地址是 Nous Research/Hermes-3。
支持MCP工具调用,也支持Nous自有的工具集。
如果你也在做AI应用开发,或者公司接入了大量MCP服务,可以去跑一下这个项目,看看能不能解决你们context爆炸的问题。
至少目前来看,渐进式schema披露这条路是走得通的。
夜雨聆风