乐于分享
好东西不私藏

Claude Code吞金兽?一个工具让你随便用!

Claude Code吞金兽?一个工具让你随便用!

如果你最近在用 Claude Code 写代码,大概率已经感受过一种很微妙的崩溃感。
一开始,体验很好。
它读代码很快,改文件很快,查问题也很快。
你会觉得,太强了,这简直像请来了一个全天在线的全栈工程师。
可用着用着,问题就来了。
它开始变慢。
开始忘事。
开始前面刚说过的话,后面像没见过一样,乱七八糟开始胡言乱语。
有时候一个 session 还没跑多久,模型就已经“缩水”了,像是脑子突然被清空了一部分。
文件忘了,任务断了,之前做过的决定也开始丢。
而且,账单还越来越长,coding plan也一下子就跑完了。
很多人会把这个问题理解成:Claude Code 太贵了。
但如果你往下看一层,你会发现,真正烧钱的地方,常常不在你以为的地方。
问题很可能出在一个大家平时不会特别注意的东西上——context,也就是上下文窗口。
最近看到一个关于Context Mode的技术讲解,里面把这个问题拆得很清楚。
你的上下文正在被工具调用的大量原始输出反复塞满。

Claude Code 真正贵在“搬运”

很多人平时用 Claude Code,会默认一件事:
工具调用嘛,就是为了让 AI 更有效率。
它去读文件、抓网页、看 issue、分析日志,这些动作本来就是应该的。
这话当然没错。
可问题在于,Claude Code 处理这些工具调用的方式,本身就很吃上下文。
在 Claude Code 里,每一次 MCP tool call,工具返回的完整输出都会直接塞进模型的 200K context window 里。
也就是说,工具查回来的内容,并不会安安静静待在某个外部空间里,等需要时再调取;它会直接进入对话上下文,跟着整场会话一起被反复带上。
这个机制一旦遇到大文件、大网页、大量 issue,代价会非常夸张。
比如一个 Playwright 的网页 snapshot,大概是56KB
读 20 个 GitHub issues,大概是59KB
如果这些操作在规划阶段反复来几轮,模型在还没正式开始写代码之前,就可能已经吃掉了70% 的上下文窗口
你想一想,这有多离谱。
代码还没写几行,思考空间已经快被工具输出挤没了。
后面贵都已经不是事儿了,而是越聊越没“脑子”,从高智商变成小智障。你问它任务是什么?阿巴阿巴阿巴阿巴
这件事很多人都经历过。
一个 session 开始时,它思路清晰,记忆完整,改代码像一个专注的工程师。
可一段时间之后,状态突然开始滑坡。
它会忘记十分钟前刚写过的逻辑。
会重复已经失败过的修复方法。
会搞混文件。
会在多步骤任务里掉链子。
在某些使用方式下,你可能只有30 分钟左右的活跃 agent 时间,之后上下文就会开始 compact。
一旦 compact 发生,很多之前积累下来的细节就会被压缩,甚至直接掉失。
这时候,AI 还在继续哼哧哼哧埋头干活,但你已经开始想ctrl D了。
token 已经花出去了,任务反而完不了。
心态爆炸,垃圾软件,毁我青春……
如何解决呢?很简单,一个工具即可。
Context Mode ——在 Claude 和操作系统之间,加了一层“上下文虚拟化”的缓冲层。
有了它,AI 不再直接跟你的 OS 对话,而是先经过一个 sandbox。
工具输出也不再一股脑塞进上下文,而是先被收纳、索引、压缩,然后按需要再检索。
Context Mode 会把这些大块输出放进一个本地的SQLite 数据库里,并用FTS5(全文搜索)做索引。
这样一来,Claude 并不需要把整个网页快照、整个日志文件、整批 issues 全部背进上下文里。
它只需要知道:这些内容已经被索引好了,之后可以按需搜索
举两个特别直观的例子:
一个56KB 的 Playwright snapshot,压到只剩299 bytes
一个 analytics CSV,被压到222 bytes
这基本就是99% 级别的缩减,这已经不是“小优化”了,这几乎是在重新定义上下文该怎么用。
以前的方式,是把东西全部塞进一个py, def一大堆,function乱窜,想改都找不到先改谁。
现在Context Mode 的做法,就是分层,把资料放进一个可搜索的仓库里,需要的时候再精准拿出来。
脑子里终于不再堆满杂物,真正的推理空间也就出来了。
但是,saving tokens is just one part of the fix。
真正让这个工具有价值的地方,在于它在想办法保护一场 coding session的连续性。
因为我们都知道,AI 最怕的不是信息少。
最怕的是中途失忆。
尤其在写代码这件事上,连续性一断,整个体验就会瞬间下滑。这也是为啥大厂裁员之后又喊回去,发现人重要的是后续的维护,写得不快,但是我维护给力、稳定啊。
AI一旦断档,总是选择rewrite,很难结构性长期性的保持同等状态。
Context Mode 在这方面做了一件很关键的事:
它会通过 hooks 去监控文件编辑、get 操作、subagent 任务等关键动作。
当上下文 compact 发生时,它会生成一个带优先级的 snapshot,通常控制在2KB 以内,然后再把这个“检查点”注入回去。
这就像游戏里的存档点,你走到一半,哪怕场景切换了、内存清了,关键进度还在,Claude 不至于一下子回到“只记得开头”的状态。
之前写过什么、哪一版尝试失败过、哪些决定已经做出过,这些信息可以被更有结构地保留下来。
在这种机制下,session 时间理论上可以从30 分钟延长到大约 3 小时
我一直觉得,AI coding 到了今天,大家开始慢慢进入第二阶段了。
第一阶段,大家最兴奋的是:
AI 会写代码了。
AI 能读 repo 了。
AI 能跑命令了。
AI 能修 bug 了。
可用着用着,很多人会进入第二阶段:
开始意识到,真正决定体验上限的,已经不只是“它会不会做”,而是“它能不能持续、稳定、低损耗地做”。
这时候,context management 这种东西的重要性就上来了。
因为 AI 编程里最昂贵的成本,很多时候并不是一次推理调用。
更大的损耗,常常来自混乱。
上下文混乱。
信息冗余。
大文件被整块塞进去。
已经看过的数据一遍又一遍重传。
失败过的方法又重新试一遍。
前面做过的决定后面又忘了。
这些事情叠在一起,才是账单越来越高、体验越来越差的真正原因。
所以 Context Mode 的价值不仅仅是省钱、省时间,比如,给模型清掉噪音,留出真正思考的空间。更重要的是,让我们持续地使用AI作为partner,而不是一次性消耗品。
再强,没有续航,在马拉松比赛里也是个小垃圾。
本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » Claude Code吞金兽?一个工具让你随便用!

猜你喜欢

  • 暂无文章