你的AI编程账单一半是浪费的,这个插件真的可以减少98%?

凌晨三点，GitHub 热榜第一是个什么玩意

△图片来自于网络

6 月 9 号凌晨，GitHub 趋势榜上冒出来一个东西，叫 context-mode。三天之内 1.5 万 Star，24 万多开发者接了进去。

我点进去看了下，三分钟后就点了 Fork。

这东西解决的问题太要命了：用 AI 写代码的时候，聊到一半模型就忘了你之前说过什么。你刚告诉它这个变量不能改，六轮对话之后它又去改了。你翻回去补一句上下文，一次 API 调用几十万 Token 烧进去，月底账单看得你肉疼。

context-mode 说，我能把成本打下来 98%，顺便把模型的记忆力从半小时拉到三小时。

一开始我以为是那种夸大的项目介绍。看完代码和原理之后，我收回了这句话。

先搞清楚 AI 编程到底烧钱在哪里

△图片由AI生成

大多数人以为 AI 写代码贵是因为模型本身贵。不全对。

真正的烧钱点在上下文。你每跟 AI 说一句话，AI 要回忆你们之前说过的所有内容，才能理解你现在这句话是什么意思。所以你每发一条消息，它都要把整段对话历史重读一遍，按 Token 计费。

一段正常工作量的编程对话，聊到后面，上下文轻轻松松破十万 Token。十万 Token 是什么概念，用 Claude Sonnet 的话，光输入就几十美分。一天下来，几美金是起步价。如果你是重度用户，一个月几百美金打不住。

更肉疼的是，这些 Token 里很大一部分是浪费的。你用 Cursor 写代码，MCP 工具一调用，把整个项目文件往上下文里一灌。你的项目可能有五十个文件，但 AI 其实只需要看其中三四个。剩下的四十六个文件，全是无效消耗。你付了钱，AI 被分了心，两边都亏。

context-mode 盯上的就是这个窟窿。

我跟好几个做独立开发的朋友聊过这件事。他们每个月光 AI 编程工具的费用在两百到四百美金之间，其中有至少一半的调用量是被这些无效文件吃掉的。你说亏不亏。一个程序员花钱请 AI 帮忙写代码，结果 AI 花了一半的脑子在重读那些根本不需要的东西。

它做的事不复杂，但是真管用

context-mode 核心逻辑只有一句话：别让 AI 直接碰原始数据。

具体干了三件事。

△图片由AI生成

第一件，虚拟沙盒。相当于在 AI 和你的项目文件之间加了一个数据门卫。AI 要查东西，先到这个门卫那里登记一下。门卫从你项目里精准捞出 AI 真正需要的那几行，扔给它。剩下的文件，看都不给看。79.3KB 的文件，一轮操作下来 Token 消耗直接降了 87.7%。

第二件，存档点。AI 写代码最烦的就是聊太久之后开始犯傻。主流 IDE 都有隐藏的上下文上限，代码量一上去，系统就会偷偷把你的历史对话给裁了。关键信息被裁掉之后，AI 就开始放飞自我。context-mode 的做法是，它监控你的每一次文件编辑，上下文快满的时候，自动帮你把关键信息浓缩成一个不到 2KB 的快照塞回去。AI 看到快照，等于看到了整个项目的历史。团队实测，这套机制把 AI 连续编程的有效时间从半小时撑到了三小时。

第三件，用代码思考。这个名听着有点技术，其实就是换了个思路。传统用法是你把所有文件丢给 AI，让它去逐行读、逐行分析。一百个文件，它就要读一百遍。context-mode 的思路反了过来：遇到要处理大量数据的时候，别让 AI 自己读，先让它写一个小脚本，脚本在本地跑完，把结果给它。AI 不用碰原始数据，只看最终结果。创始人自己的同事去参加 Kaggle 比赛，让 Claude 盯着三百组数据训练，模型为了确认进度，每五秒做一次全局检索，高配会员的 API 额度半小时烧掉 90%。换成这个范式之后，同样的事情只花了一点零头。

98% 不是吹的，是真算出来的

△图片来自于网络

团队做了大量的实测。单文件处理上，Token 消耗差了 99.98%。综合长周期项目跑下来，整体成本就是降了 98%。

你取一万块的 AI 编程账单，用上它之后剩两百块。你自己品。

而且这个数据是手算得出来的。我自己接进去实测了一下午。之前一个中型项目，用 Claude Sonnet 改一轮代码大概吃掉二十万 Token，接入之后同样一轮不到四千。十几倍的差距，肉眼可见。你不需要看后台数据，账单上那个数字自己就会告诉你。

而且它不是只支持某一个模型。context-mode 是个 MCP 插件，已经把十五个主流平台的底层都适配好了。Cursor 能用，Claude 能用，Gemini 能用。微软、谷歌、Meta、字节的研发团队已经在用了。你不用换 IDE，也不用改工作流，挂上就行。

写这个项目的人有点意思

△图片由AI生成

创始团队主力就两个人，跨国协作，一个在土耳其，一个在中国，靠 GitHub 写代码交流。

Mert Köseoğlu，土耳其人，十年全栈经验，给 OpenAI 当过技术顾问，之前在 Jotform、Planhat 这些数据平台做高级工程师。他应该是这个想法的起源。

孙逸诚，中国人，大二在读，之前进过数学物理强基计划全省前十八，独立开发过时序数据检索引擎，拿过知乎的 Agent 黑客松银奖。多平台适配是他做的。

一个大二学生，一个跨国老炮，写了个插件，帮 24 万开发者每个月省几百美金。

这种故事我永远爱看。

而且它说明了一件事：AI 编程工具的优化空间还大得离谱。过去一年所有人都在追更好的模型、更大的上下文窗口，没人认真想过一个问题：是不是我们的用法本身就是浪费。context-mode 做的事不新，就是改了个交互范式，效果就炸了。这比任何一个新模型的性价比都高。

你要不要试试？

△图片由AI生成

context-mode 目前开源，GitHub 上直接拿。本地有个数据面板，能看当周 API 调用次数和拦截了多少无效读取。企业版还在内测，能生成安全审查和财务分析报告。

当然这不是说每个写代码的人都需要它。如果你一个月就花十几美金在 AI 编程上，装不装区别不大。但如果你像我一样重度依赖 AI 写代码，或者你们团队在用 AI 做开发，那这个插件的价值是实际算得出来的。省 98%，六个字就够了。

GitHub 上搜 context-mode，第一条就是。

试一下，反正是免费的。最坏的情况也就是你装了之后发现自己一个月确实没花多少钱在 AI 编程上。那也挺好。