给AI Coder推荐一个省 token工具
最近看到一个很适合 AI Coding 用户的项目:
codegraph,地址:
https://github.com/colbymchenry/codegraph
它的逻辑其实很简单:很多 agent 在代码库里干的第一件事,不是写代码,而是反复 grep、开文件、猜入口、找调用方,来回几轮才找到真正该看的地方。
codegraph做的事情,是先用静态 AST 把仓库里的符号、引用、调用关系建成本地结构化数据库,再通过文件监听动态更新索引,然后把这些能力通过 MCP 暴露给模型。
这样模型问的就不再是“哪些文件可能相关”,而是“这个符号在哪”“谁调用了它”“改它会影响谁”。像 query、impact、callers/callees这些场景,都会比纯 grep更省 token,也更少走弯路。
这里还有一个很值得注意的 issue:[Issue #571]
https://github.com/colbymchenry/codegraph/issues/571
codegraph还提供一个叫codegraph_context 的 MCP 工具,想做的是“帮模型自动拼上下文”。但这个能力是 100% local,本地完成的,对比LLM,其实是不擅长的,实际暴露给模型,反而容易误导模型去拿一堆“看起来相关、但不一定真相关”的上下文,效果并不稳定。
作者在issue下面的回复也说,下个版本准备把 context去掉,现在可以先disable掉。
整体效果,有用肯定是有用,但是实话实说,体感大概对纯Java项目来说10%左右或者不到吧,没有READ ME里面说的20%-30%这么多,可能和场景有关。
最后,很多动作在普通 IDE 里其实很普通,但到了模型和 agent 这里,就会直接变成能力和成本问题。把 IDE 里的高频结构化能力重新做给 agent,我觉得也是提升模型能力、同时省 token 的方向和启发。
#省token #aicoding #codegraph #codex #claude
夜雨聆风