装了这个免费插件,Claude 的 token 账单直接打 35 折

67.5k 星，185 次提交，核心逻辑只有 74 行 Markdown。实测能把 Claude 的输出从 1214 token 压到 294 token——不是让 AI 变蠢，是让它学会闭嘴说重点。省几百块 token 费只是小头，真正省的是你读回复的时间。

上个月看 Claude Code 的 API 账单，200 多刀。

不多。但翻了一下对话记录，有句话跳出来特别刺眼

"Let me explain the root cause of this issue in detail and provide several possible solutions. First, we need to understand React's rendering mechanism..."

这 40 个字，值 2 毛钱。而同一个问题，caveman 模式的回答是四个词。值 3 分钱。

67.5k 人给它点了星，不是没道理。

这是什么

caveman，一个 Claude Code skill。叫插件也行、扩展也行、工具也行——怎么叫不重要。

重要的事一句话：让 AI 像穴居人一样说话。砍掉 65%-75% 的输出 token。

Star: 67.5k | Fork: 3.8k | License: MIT | Commits: 185 语言: JavaScript 63%, Python 28%, PowerShell 5%, Shell 5%

作者 Julius Brussee，2026 年 4 月 4 号创建。两个月，67.5k 星，27 个贡献者，14 个 release，最新 v1.8.2。

它不只是 Claude Code 能用——30+ 个 AI coding agent 全支持：Codex、Gemini、Cursor、Windsurf、Cline、Copilot。一个安装脚本全覆盖。

它到底省了多少

先看一个真实的例子。

正常 Claude（69 token）：

"The reason your React component is re-rendering is likely because you're creating a new object reference on each render cycle. When you pass an inline object as a prop, React's shallow comparison sees it as a different object every time, which triggers a re-render. I'd recommend using useMemo to memoize the object."

Caveman 模式（19 token）：

"New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo."

同样的技术建议。69 token 变 19 token。省了 72%。

再来看官方 benchmark——10 个实际任务，通过 Claude API 统计的真实 token 数：

任务	正常	Caveman	省
React 重渲染解释	1180	159	87%
认证中间件修复	704	121	83%
PostgreSQL 连接池	2347	380	84%
React 错误边界实现	3454	456	87%
Docker 多阶段构建	1042	290	72%
PostgreSQL 竞态调试	1200	232	81%
Git rebase vs merge	702	292	58%
PR 安全审查	678	398	41%
微服务 vs 单体架构	446	310	30%
回调改 async/await	387	301	22%
平均	1214	294	65%

两头看看。

最高省 87%——React 入门解释、中间件修复、错误边界实现。这类"让我帮你理解"型的回答，caveman 一刀砍掉所有铺垫。

最低省 22%——代码重构（回调改 async/await）。废话本来就不多，diff 本身就是精简的。caveman 不是魔法，能砍的只有废话。

顺便说一个容易被忽略的细节：caveman 只压缩输出 token。思考/推理部分原封不动。AI 的脑子一样聪明，只是嘴变小了。

我装了一遍，踩了两个坑

拿到项目第一件事当然是装。官网说一行命令 30 秒搞定。

坑 1：Windows PowerShell 上翻车了。

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

在 PowerShell 5.1 上直接报错：VariableNotWritableRare。$Args 变量不可写——这是 PS 5.1 的已知问题，iex 在某些配置下无法处理远程脚本的变量赋值。

手动下载 ZIP，解压到项目目录，2 分钟搞定。Windows 用户遇到同样的问题，直接用 npx 或者手动下载，别跟一行命令死磕。

坑 2：打开 SKILL.md 的那一刻，我愣了几秒。

我以为会看到一个压缩算法。几百行正则、tokenizer 逻辑、或者至少是一个微调过的模型。

打开 skills/caveman/SKILL.md——74 行 Markdown。

67.5k 星的项目，核心就是一个系统提示词。写得像穴居人张嘴，精准得像外科手术。不是 joke。

74 行 Markdown，省 75% 的废话。少即是多这四个字，写在 GitHub 文件里比写在哪都狠。

五个子命令，两个让我意外的好东西

caveman 不是一个"开/关"按钮。它有一个完整的 skill 生态：

子命令	干什么	实用度
/caveman [lite\|full\|ultra\|wenyan]	切换压缩档位	5/5
/caveman-commit	生成 Conventional Commit，<=50字符	3/5
/caveman-review	PR 评论一行流：L42: bug: user null.	3/5
/caveman-stats	当前会话 token 用量 + 累计省钱	4/5
/caveman-compress	MEMORY 文件压成 caveman 语	5/5

说两个让我意外的功能。

文言文模式（wenyan）。

caveman 的 wenyan 档是我觉得整个项目最聪明的一个设计。

文言文天然就是 token 压缩语言——主语省略、虚词精简、单字成词。古人写信就是 caveman。而这个模式也分 lite/full/ultra 三档。中文用户独享一个体验维度，别的语言没有。

caveman-compress：不只是单次省 token。

这个功能可以把你项目里的 CLAUDE.md、项目笔记这类 MEMORY 文件也压成 caveman 语。官方实测：

文件	原始 token	压缩后	省
claude-md-preferences	706	285	60%
project-notes	1145	535	53%
claude-md-project	1122	636	43%
todo-list	627	388	38%
mixed-with-code	888	560	37%
平均	898	481	46%

输出省 65%，输入省 46%。这意味着每次对话启动时，你的系统提示词就是压缩过的。不是省一次，是每次对话都省。叠加起来，一个月的账单降幅比单次 benchmark 更大。

AI 行业得了啰嗦病

AI 的啰嗦不是能力问题，是指令问题。

Claude 说"Let me explain this in detail"，GPT 说"当然，我很乐意帮助你"，Gemini 说"I understand your concern and I'll address it step by step"。每个字都是 token，每个 token 都要钱。而 90% 的开场白，用户脑子里已经自动 skip 了。

OpenAI 和 Anthropic 自己为什么不解决这个问题？因为他们的训练目标是"像人"，不是"高效"。用大量礼貌用语和解释性铺垫来降低 AI 的机械感。友好感越强，token 用得越多——这是一场零和对冲。

caveman 用 74 行 Markdown 解决了这个问题，说明一个尴尬的事实：你只需要告诉 AI "别废话"，它就真的不废话了。大厂不是做不到，是不愿意牺牲"拟人感"。

更有意思的是：根据 README 引用的 2026 年 3 月论文 "Brevity Constraints Reverse Performance Hierarchies in Language Models"——强制大模型以简洁方式回答，在某些 benchmark 上准确率反而提升了 26 个点。

少说。更快。更准。更便宜。

适合谁，不适合谁

适合：

每天用 Claude Code / Codex / Gemini 超过 2 小时的。省的不只是 token 费，是读回复的时间——每次回复短了 3/4，扫一眼就懂

中文用户——wenyan 文言文模式独一无二

接入了 30+ 个 agent 还嫌 AI 话多的

不适合：

主要工作是改代码而非问问题的。代码 diff 本身不废话，caveman 收益 22% 左右

需要 AI 写文档、写方案、面向人类阅读的场景。这时候"废话"是修辞，不是浪费

觉得 AI 的友善语气是核心体验的

caveman 的 README 最后一句话："Caveman save you token, save you money. Star cost zero. Fair trade."

一个 74 行 Markdown 的项目，两个月 67.5k 星。不是因为技术多复杂——是因为它戳中了一个每个人都在忍的痛点，然后把解法做得只剩一块石头。

装一个试试，不行就关掉。

每天一个开源瓜，写代码就像开挂