我每个月花在AI编程工具上的Token,有80%是废话
上个月我把 Claude Code 的 API 账单导出来看了一眼——测试日志、 git 状态、目录列表,这些 AI 根本不需要的信息,占了我总消耗的 80%。
一、你的 Token 去哪了
打开 Claude Code ,跑一个 cargo test。
它输出了 200 行。其中 180 行是”test xxxx … ok”。有用的信息只有最后 5 行——有没有失败、失败在哪。
但这 200 行全被塞进了上下文,全被你的 API 账单买单了。
这不是个别现象。当 AI 编程助手执行命令时,它拿到的是命令的原始输出,不做任何筛选。git status、ls -la、pytest、npm install……每一次命令调用,都有大量对 AI 判断没有价值的内容在消耗你的 Token 配额。
rtk (全名 Rust Token Killer )就是专门来干这件事的:在命令输出到达 AI 上下文之前,先帮你把废话过滤掉。
39.2k Star , Rust 编写,单二进制零依赖,支持 Claude Code / Cursor / Copilot / Gemini CLI 等 12 款主流 AI 编程工具。
二、原理:它在哪里”截胡”
rtk 的工作位置很关键——它插在”命令执行”和”AI 接收输出”之间。
[你的Claude Code]→[Bash工具调用 git status]
↓
[rtk Hook 拦截]
↓
[rtk 压缩输出:200行 → 12行]
↓
[AI只看到12行精华]
它不是替换你的 AI 工具,也不是改你的代码。它就是在输出管道里加了一个”过滤器”。
四种压缩策略:
| 策略 | 作用 | 典型场景 |
|---|---|---|
| 智能过滤 | 删噪声内容、注释、进度条 | npm install的下载进度 |
| 分组聚合 | 相似内容归类展示 | 测试结果: N passed, M failed |
| 截断优化 | 保留核心信息,削减重复 | git log只保留关键 commit |
| 去重折叠 | 重复日志行计数折叠 | cargo test的 pass 行 |
关键设计:失败信息不压缩。 测试失败、报错堆栈, rtk 会保留完整内容。压的是那些对 AI 判断没有帮助的”成功日志”。
三、真实省钱数字——官方说 90%,实测是多少
官方给了一张基于中型项目 30 分钟会话的数据:
| 操作 | 原始 Token | 压缩后 | 节省 |
|---|---|---|---|
| ls / tree ( 10 次) | 2000 | 400 | 80% |
| cat / read ( 20 次) | 40000 | 12000 | 70% |
| git status ( 10 次) | 3000 | 600 | 80% |
| cargo test / pytest ( 5 次) | 25000 | 2500 | 90% |
| 总计 | ~118000 | ~23900 | 80% |
这个数字是真的吗?
实测数据更保守:一个 Java 项目 mvn test 场景,节省约 70%;一个完整的 Claude Code 会话( 18.2k 输入 Token ),实测节省 67.8%。
结论:官方宣传的 90%是最优场景,综合节省在 60-70%之间更符合实际。 但 60%已经非常可观了——相当于每花 1 块钱 API 费用,以前有 0.6 块是在喂废话。
四、安装:三分钟搞定
macOS (最简单):
brewinstallrtk
Linux / macOS 通用:
curl-fsSLhttps://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh|sh
exportPATH="$HOME/.local/bin:$PATH"
装完之后,初始化对应的 AI 工具:
rtkinit-g# Claude Code 或 GitHub Copilot
rtkinit-g--gemini# Gemini CLI
rtkinit--agentcursor# Cursor
rtk init会在你的 Shell 配置里加入 Hook ,之后重启 AI 工具就自动生效。用rtk gain可以随时查看累计节省了多少 Token 。
踩坑一: cargo 安装别用 crates.io 。 cargo install rtk会装到另一个同名包,必须用 git 源:cargo install --git https://github.com/rtk-ai/rtk。
踩坑二: Windows 原生不支持自动 Hook 。 Windows 用户必须上 WSL ,否则只能手动调用rtk git status这种形式,失去了”透明接管”的最大优势。
踩坑三: Hook 只管 Bash 工具。 Claude Code 内置的 Read 、 Grep 、 Glob 工具不走 Hook ,要压缩这些操作需要手动用rtk read、rtk grep。不是大问题,但别以为装了就全自动了。
五、三个真实使用场景
场景一:测试驱动开发(省得最多)
你让 Claude Code 写功能、跑测试、修 bug 这种循环。每次cargo test或pytest都输出几百行,其中 95%是 PASSED 日志。
rtk 会把所有通过的测试折叠成一行计数,失败的测试保留完整信息。一个中等项目的测试输出从 200+行压到 20 行左右。这个场景节省最明显。
场景二:大型代码库探索(中等效果)
Claude Code 读目录结构、搜索文件、看 git 历史。ls -la、tree、git log这些命令的输出 rtk 都会裁剪,只保留对当前任务有关的部分。
效果中等,主要看代码库大小。小项目体感不明显,大项目很有感。
场景三:配置踩坑(最容易翻车)
有用户反映, rtk 有时候压缩得太狠,导致 AI 拿到的信息不够,反而再次执行同一个命令——结果比没装 rtk 还多花了 Token 。
这种情况的解法是把”需要完整输出”的命令加入排除列表:
[commands]
exclude=["vim","nano","less","你出问题的命令"]
rtk discover命令可以帮你分析哪些命令消耗 Token 最多,从那里入手调整最有针对性。
六、省 Token 三件套, rtk 是最直接的那个
你可能注意到,近期我写了三款都和”省 API 钱”有关的工具:
| 工具 | 省钱路径 | 适合谁 |
|---|---|---|
| abtop | 监控 token 消耗,发现问题 | 想知道钱花哪了 |
| GenericAgent | 更小上下文窗口的 Agent 架构 | 愿意换框架的人 |
| rtk | 直接过滤废话输出 | 所有 AI 编程工具用户 |
三者不互斥,可以同时用。但如果只能选一个,rtk 的门槛最低,效果最直接,三分钟装完马上生效。
唯一需要心理建设的是:装完之后你会意识到,之前有多少钱是交学费的。
适合你如果:
– 每周用 Claude Code / Cursor / Copilot 超过 10 小时
– 经常跑测试、执行 git 操作、探索大型代码库
– 在意 API 账单,想以最小改动获得最大收益
可以先不装如果:
– 用 AI 主要是对话,不是代码调试
– 每次会话都很短, Token 消耗不是痛点
– Windows 原生用户,不想折腾 WSL
最后一句:官方说节省 90%,实测是 60-70%。就算只有 60%,也是每花 1 块省 6 毛。这条命令你可以现在就运行:brew install rtk。
本文基于 rtk v0.38.0 ( 2026 年 4 月末版本)测试。
夜雨聆风