乐于分享
好东西不私藏

我每个月花在AI编程工具上的Token,有80%是废话

我每个月花在AI编程工具上的Token,有80%是废话

上个月我把 Claude Code 的 API 账单导出来看了一眼——测试日志、 git 状态、目录列表,这些 AI 根本不需要的信息,占了我总消耗的 80%。


一、你的 Token 去哪了

打开 Claude Code ,跑一个 cargo test

它输出了 200 行。其中 180 行是”test xxxx … ok”。有用的信息只有最后 5 行——有没有失败、失败在哪。

但这 200 行全被塞进了上下文,全被你的 API 账单买单了。

这不是个别现象。当 AI 编程助手执行命令时,它拿到的是命令的原始输出,不做任何筛选。git statusls -lapytestnpm install……每一次命令调用,都有大量对 AI 判断没有价值的内容在消耗你的 Token 配额。

rtk (全名 Rust Token Killer )就是专门来干这件事的:在命令输出到达 AI 上下文之前,先帮你把废话过滤掉

39.2k Star , Rust 编写,单二进制零依赖,支持 Claude Code / Cursor / Copilot / Gemini CLI 等 12 款主流 AI 编程工具。


二、原理:它在哪里”截胡”

rtk 的工作位置很关键——它插在”命令执行”和”AI 接收输出”之间。

[你的Claude Code][Bash工具调用 git status]

[rtk Hook 拦截]

[rtk 压缩输出:200行 → 12行]

[AI只看到12行精华]

它不是替换你的 AI 工具,也不是改你的代码。它就是在输出管道里加了一个”过滤器”。

四种压缩策略:

策略 作用 典型场景
智能过滤 删噪声内容、注释、进度条 npm install的下载进度
分组聚合 相似内容归类展示 测试结果: N passed, M failed
截断优化 保留核心信息,削减重复 git log只保留关键 commit
去重折叠 重复日志行计数折叠 cargo test的 pass 行

关键设计:失败信息不压缩。 测试失败、报错堆栈, rtk 会保留完整内容。压的是那些对 AI 判断没有帮助的”成功日志”。


三、真实省钱数字——官方说 90%,实测是多少

官方给了一张基于中型项目 30 分钟会话的数据:

操作 原始 Token 压缩后 节省
ls / tree ( 10 次) 2000 400 80%
cat / read ( 20 次) 40000 12000 70%
git status ( 10 次) 3000 600 80%
cargo test / pytest ( 5 次) 25000 2500 90%
总计 ~118000 ~23900 80%

这个数字是真的吗?

实测数据更保守:一个 Java 项目 mvn test 场景,节省约 70%;一个完整的 Claude Code 会话( 18.2k 输入 Token ),实测节省 67.8%。

结论:官方宣传的 90%是最优场景,综合节省在 60-70%之间更符合实际。 但 60%已经非常可观了——相当于每花 1 块钱 API 费用,以前有 0.6 块是在喂废话。


四、安装:三分钟搞定

macOS (最简单)

brewinstallrtk

Linux / macOS 通用

curl-fsSLhttps://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh|sh
exportPATH="$HOME/.local/bin:$PATH"

装完之后,初始化对应的 AI 工具:

rtkinit-g# Claude Code 或 GitHub Copilot
rtkinit-g--gemini# Gemini CLI
rtkinit--agentcursor# Cursor

rtk init会在你的 Shell 配置里加入 Hook ,之后重启 AI 工具就自动生效。用rtk gain可以随时查看累计节省了多少 Token 。

踩坑一: cargo 安装别用 crates.io cargo install rtk会装到另一个同名包,必须用 git 源:cargo install --git https://github.com/rtk-ai/rtk

踩坑二: Windows 原生不支持自动 Hook 。 Windows 用户必须上 WSL ,否则只能手动调用rtk git status这种形式,失去了”透明接管”的最大优势。

踩坑三: Hook 只管 Bash 工具。 Claude Code 内置的 Read 、 Grep 、 Glob 工具不走 Hook ,要压缩这些操作需要手动用rtk readrtk grep。不是大问题,但别以为装了就全自动了。


五、三个真实使用场景

场景一:测试驱动开发(省得最多)

你让 Claude Code 写功能、跑测试、修 bug 这种循环。每次cargo testpytest都输出几百行,其中 95%是 PASSED 日志。

rtk 会把所有通过的测试折叠成一行计数,失败的测试保留完整信息。一个中等项目的测试输出从 200+行压到 20 行左右。这个场景节省最明显。

场景二:大型代码库探索(中等效果)

Claude Code 读目录结构、搜索文件、看 git 历史。ls -latreegit log这些命令的输出 rtk 都会裁剪,只保留对当前任务有关的部分。

效果中等,主要看代码库大小。小项目体感不明显,大项目很有感。

场景三:配置踩坑(最容易翻车)

有用户反映, rtk 有时候压缩得太狠,导致 AI 拿到的信息不够,反而再次执行同一个命令——结果比没装 rtk 还多花了 Token 。

这种情况的解法是把”需要完整输出”的命令加入排除列表:

[commands]
exclude=["vim","nano","less","你出问题的命令"]

rtk discover命令可以帮你分析哪些命令消耗 Token 最多,从那里入手调整最有针对性。


六、省 Token 三件套, rtk 是最直接的那个

你可能注意到,近期我写了三款都和”省 API 钱”有关的工具:

工具 省钱路径 适合谁
abtop 监控 token 消耗,发现问题 想知道钱花哪了
GenericAgent 更小上下文窗口的 Agent 架构 愿意换框架的人
rtk 直接过滤废话输出 所有 AI 编程工具用户

三者不互斥,可以同时用。但如果只能选一个,rtk 的门槛最低,效果最直接,三分钟装完马上生效

唯一需要心理建设的是:装完之后你会意识到,之前有多少钱是交学费的。

适合你如果
– 每周用 Claude Code / Cursor / Copilot 超过 10 小时
– 经常跑测试、执行 git 操作、探索大型代码库
– 在意 API 账单,想以最小改动获得最大收益

可以先不装如果
– 用 AI 主要是对话,不是代码调试
– 每次会话都很短, Token 消耗不是痛点
– Windows 原生用户,不想折腾 WSL

最后一句:官方说节省 90%,实测是 60-70%。就算只有 60%,也是每花 1 块省 6 毛。这条命令你可以现在就运行brew install rtk


本文基于 rtk v0.38.0 ( 2026 年 4 月末版本)测试。