别让AI废话烧你的Token!Caveman专治编程助手话痨-夜雨聆风

别让AI废话烧你的Token!Caveman专治编程助手话痨

一个正在发生的变化是：主流AI模型厂商的计费模式，正在逐步从“订阅能力”转向“按Token计费”。在这种必然的前提下，每一个字的输入与输出，都是实打实的真金白银，编程工具那友善、客气的回答表述，表面上看是在提供更舒心AI服务，本质上却也让你在使用过程中为大量无效表达付费。

类似“我很乐意帮你”“请参考以下建议”这样的表达，在实际开发场景中几乎没有信息增量，却持续消耗Token。单次影响不明显，但在高频调用下，累积成本会变得相当可观。

GitHub开源工具「Caveman」正是针对这一问题设计。它本质上是一个以Claude Code为核心的插件（兼容40+AI编程工具），核心逻辑很直接：剔除冗余表达，仅保留技术信息，把AI从“话多”变成“干脆”。

经测试，在不牺牲技术准确性的前提下，实际可减少高达约75%的输出Token，同时显著提升响应速度与阅读效率。

🎮 核心操作：快速切换精简模式

Caveman几乎没有学习成本，安装后即可使用，核心操作也比较清晰：

模式触发：输入 /caveman（默认Full模式），或使用“talk like caveman”“less tokens please”。

档位切换：提供两种模式三种强度，可根据场景选择：

Intensity Levels

传统模式

Lite：去除填充语，保留完整语法，适合偏正式场景。

Full：默认模式，短句+碎片表达，Token节省明显。

Ultra：极限压缩，接近电报风格，用于快速获取结论。

Wenyan Mode

文言文模式

wenyan-lite：半古典风格文言文模式，以完整语法表达技术内容，兼顾可读性与趣味性。

wenyan：文言文模式，以精简古文表达技术内容，兼顾可读性与趣味性。

wenyan-ultra：极端文言文模式，以极端精简的古文表达技术内容，极限压缩输出内容（一般不要轻易尝试，娱乐尚可）。

模式停止：输入“stop caveman”或“normal mode”即可恢复。

状态提示：Claude Code状态栏会显示 [CAVEMAN] 或 [CAVEMAN:ULTRA]。

📊 效果对比：Token节省一目了然（Claude Code实测）

Caveman的核心优势可通过实测场景直观体现，以下两组典型案例中，技术信息完全一致，Token消耗差距显著：

▶️ 场景1：React组件重渲染问题

🗣️ 常规Claude输出（69 Token）：“The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle. When you pass an inline object as a prop, React’s shallow comparison sees it as a different object every time, which triggers a re-render. I’d recommend using useMemo to memoize the object.”

（冗余表述占比超50%，核心解决方案被大量铺垫掩盖）

🪨 Caveman模式输出（19 Token）：“New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo.”

（核心解决方案直击要点，Token消耗减少72%，阅读效率大幅提升）

▶️ 场景2：auth中间件Token过期问题

🗣️ 常规Claude输出（58 Token）：“Sure! I’d be happy to help you with that. The issue you’re experiencing is most likely caused by your authentication middleware not properly validating the token expiry. Let me take a look and suggest a fix.”

（客套话占据近三分之一篇幅，无效Token消耗明显）

🪨 Caveman模式输出（16 Token）：“Bug in auth middleware. Token expiry check use < not <=. Fix:”

（直接定位bug核心并给出修改方向，Token消耗减少72%，响应速度提升3倍）

官方实测数据显示，复杂编程任务（如PostgreSQL连接池配置、React错误边界实现）的Token节省率可达87%，全场景平均节省率65%，长期使用可显著降低Token支出成本。

🛠️ 核心技能：不止省Token，更提开发效率

Caveman并非单纯的“话术精简工具”，其内置4项实用编程辅助技能，Claude Code全量支持，可直接提升开发协作效率：

caveman-commit（精简提交信息）：输入 /caveman-commit，自动生成符合Conventional Commits规范的提交信息，字符数≤50，聚焦“修改原因”而非“修改内容”，简化提交日志，提升团队协作效率。

caveman-review（单行代码评审）：输入 /caveman-review，生成单行PR评论（如“L42: 🔴 bug: user null. Add guard.”），直击问题核心，摒弃冗余铺垫，提升代码评审效率。

caveman-compress（输入文件压缩）：输入 /caveman:compress <filepath>（如 /caveman:compress CLAUDE.md），可压缩配置文件、项目笔记等内容，平均节省46%的输入Token。该功能会保留代码、URL、文件路径等所有技术内容，仅压缩冗余 prose，同时生成人类可读的备份文件（如CLAUDE.original.md），兼顾Token节省与内容安全。

caveman-help（快速参考）：输入 /caveman-help，可一键调出所有模式、技能、命令的参考卡片，无需查阅文档，快速解决使用疑问。

📥 安装指南以 Claude Code 为例

直接运行运行

claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman

卸载操作同样便捷，执行对应卸载命令即可，不留任何冗余文件。

🔗 多工具兼容：不止Claude Code，覆盖40+AI编程工具

Caveman的兼容性覆盖主流AI编程工具，核心功能一致，安装方式简单，适配不同开发者的使用习惯：

Codex

克隆仓库→进入/plugins目录→搜索“Caveman”安装，支持仓库内自动激活。

Gemini CLI

通过命令 gemini extensions install https://github.com/JuliusBrussee/caveman 一键安装，支持更新、卸载，自带专属操作命令。

Cursor/Copilot/Windsurf/Cline

使用 npx skills add JuliusBrussee/caveman -a 工具名安装，按需添加自动激活配置即可使用。

其他40+工具（opencode、Roo、Amp等）

通过通用命令 npx skills add JuliusBrussee/caveman 安装，工具可自动识别，激活后即可使用。

🔚 核心价值

AI编程的核心是解决问题，而不是增加表达成本。随着Token计费逐渐成为主流，减少无效输出的重要性正在放大。

Caveman的价值就在于此：不改变结果，只压缩过程。在保持技术精度的同时，降低成本、提升效率。

作为MIT开源项目，几乎没有使用门槛，适合长期使用AI工具的开发者。

项目地址：https://github.com/JuliusBrussee/caveman

#AI编程 #Token优化 #开发效率 #开源工具 #ClaudeCode