乐于分享
好东西不私藏

别让AI废话烧你的Token!Caveman专治编程助手话痨

别让AI废话烧你的Token!Caveman专治编程助手话痨

一个正在发生的变化是:主流AI模型厂商的计费模式,正在逐步从“订阅能力”转向“按Token计费”。在这种必然的前提下,每一个字的输入与输出,都是实打实的真金白银,编程工具那友善、客气的回答表述,表面上看是在提供更舒心AI服务,本质上却也让你在使用过程中为大量无效表达付费。

类似“我很乐意帮你”“请参考以下建议”这样的表达,在实际开发场景中几乎没有信息增量,却持续消耗Token。单次影响不明显,但在高频调用下,累积成本会变得相当可观。

GitHub开源工具「Caveman」正是针对这一问题设计。它本质上是一个以Claude Code为核心的插件(兼容40+AI编程工具),核心逻辑很直接:剔除冗余表达,仅保留技术信息,把AI从“话多”变成“干脆”。

经测试,在不牺牲技术准确性的前提下,实际可减少高达约75%的输出Token,同时显著提升响应速度与阅读效率。

🎮 核心操作:快速切换精简模式

Caveman几乎没有学习成本,安装后即可使用,核心操作也比较清晰:

模式触发:输入 /caveman(默认Full模式),或使用“talk like caveman”“less tokens please”。

档位切换:提供两种模式三种强度,可根据场景选择:

Intensity Levels
传统模式

Lite:去除填充语,保留完整语法,适合偏正式场景。

Full:默认模式,短句+碎片表达,Token节省明显。

Ultra:极限压缩,接近电报风格,用于快速获取结论。

Wenyan Mode
文言文模式

wenyan-lite:半古典风格文言文模式,以完整语法表达技术内容,兼顾可读性与趣味性。

wenyan:文言文模式,以精简古文表达技术内容,兼顾可读性与趣味性。

wenyan-ultra:极端文言文模式,以极端精简的古文表达技术内容,极限压缩输出内容(一般不要轻易尝试,娱乐尚可)。

模式停止:输入“stop caveman”或“normal mode”即可恢复。

状态提示:Claude Code状态栏会显示 [CAVEMAN] 或 [CAVEMAN:ULTRA]。

📊 效果对比:Token节省一目了然(Claude Code实测)

Caveman的核心优势可通过实测场景直观体现,以下两组典型案例中,技术信息完全一致,Token消耗差距显著:

▶️ 场景1:React组件重渲染问题

🗣️ 常规Claude输出(69 Token):“The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle. When you pass an inline object as a prop, React’s shallow comparison sees it as a different object every time, which triggers a re-render. I’d recommend using useMemo to memoize the object.”

(冗余表述占比超50%,核心解决方案被大量铺垫掩盖)

🪨 Caveman模式输出(19 Token):“New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo.”

(核心解决方案直击要点,Token消耗减少72%,阅读效率大幅提升)

▶️ 场景2:auth中间件Token过期问题

🗣️ 常规Claude输出(58 Token):“Sure! I’d be happy to help you with that. The issue you’re experiencing is most likely caused by your authentication middleware not properly validating the token expiry. Let me take a look and suggest a fix.”

(客套话占据近三分之一篇幅,无效Token消耗明显)

🪨 Caveman模式输出(16 Token):“Bug in auth middleware. Token expiry check use < not <=. Fix:”

(直接定位bug核心并给出修改方向,Token消耗减少72%,响应速度提升3倍)

官方实测数据显示,复杂编程任务(如PostgreSQL连接池配置、React错误边界实现)的Token节省率可达87%,全场景平均节省率65%,长期使用可显著降低Token支出成本。

🛠️ 核心技能:不止省Token,更提开发效率

Caveman并非单纯的“话术精简工具”,其内置4项实用编程辅助技能,Claude Code全量支持,可直接提升开发协作效率:

caveman-commit(精简提交信息):输入 /caveman-commit,自动生成符合Conventional Commits规范的提交信息,字符数≤50,聚焦“修改原因”而非“修改内容”,简化提交日志,提升团队协作效率。

caveman-review(单行代码评审):输入 /caveman-review,生成单行PR评论(如“L42: 🔴 bug: user null. Add guard.”),直击问题核心,摒弃冗余铺垫,提升代码评审效率。

caveman-compress(输入文件压缩):输入 /caveman:compress <filepath>(如 /caveman:compress CLAUDE.md),可压缩配置文件、项目笔记等内容,平均节省46%的输入Token。该功能会保留代码、URL、文件路径等所有技术内容,仅压缩冗余 prose,同时生成人类可读的备份文件(如CLAUDE.original.md),兼顾Token节省与内容安全。

caveman-help(快速参考):输入 /caveman-help,可一键调出所有模式、技能、命令的参考卡片,无需查阅文档,快速解决使用疑问。

📥 安装指南 以 Claude Code 为例

直接运行运行

 claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman

卸载操作同样便捷,执行对应卸载命令即可,不留任何冗余文件。

🔗 多工具兼容:不止Claude Code,覆盖40+AI编程工具

Caveman的兼容性覆盖主流AI编程工具,核心功能一致,安装方式简单,适配不同开发者的使用习惯:

Codex

克隆仓库→进入/plugins目录→搜索“Caveman”安装,支持仓库内自动激活。

Gemini CLI

通过命令 gemini extensions install https://github.com/JuliusBrussee/caveman 一键安装,支持更新、卸载,自带专属操作命令。

Cursor/Copilot/Windsurf/Cline

使用 npx skills add JuliusBrussee/caveman -a 工具名 安装,按需添加自动激活配置即可使用。

其他40+工具(opencode、Roo、Amp等)

通过通用命令 npx skills add JuliusBrussee/caveman 安装,工具可自动识别,激活后即可使用。

🔚 核心价值

AI编程的核心是解决问题,而不是增加表达成本。随着Token计费逐渐成为主流,减少无效输出的重要性正在放大。

Caveman的价值就在于此:不改变结果,只压缩过程。在保持技术精度的同时,降低成本、提升效率。

作为MIT开源项目,几乎没有使用门槛,适合长期使用AI工具的开发者。

项目地址:https://github.com/JuliusBrussee/caveman

#AI编程 #Token优化 #开发效率 #开源工具 #ClaudeCode