凌晨三点,GitHub 热榜第一是个什么玩意

6 月 9 号凌晨,GitHub 趋势榜上冒出来一个东西,叫 context-mode。三天之内 1.5 万 Star,24 万多开发者接了进去。
我点进去看了下,三分钟后就点了 Fork。
这东西解决的问题太要命了:用 AI 写代码的时候,聊到一半模型就忘了你之前说过什么。你刚告诉它这个变量不能改,六轮对话之后它又去改了。你翻回去补一句上下文,一次 API 调用几十万 Token 烧进去,月底账单看得你肉疼。
context-mode 说,我能把成本打下来 98%,顺便把模型的记忆力从半小时拉到三小时。
一开始我以为是那种夸大的项目介绍。看完代码和原理之后,我收回了这句话。
先搞清楚 AI 编程到底烧钱在哪里

大多数人以为 AI 写代码贵是因为模型本身贵。不全对。
真正的烧钱点在上下文。你每跟 AI 说一句话,AI 要回忆你们之前说过的所有内容,才能理解你现在这句话是什么意思。所以你每发一条消息,它都要把整段对话历史重读一遍,按 Token 计费。
一段正常工作量的编程对话,聊到后面,上下文轻轻松松破十万 Token。十万 Token 是什么概念,用 Claude Sonnet 的话,光输入就几十美分。一天下来,几美金是起步价。如果你是重度用户,一个月几百美金打不住。
更肉疼的是,这些 Token 里很大一部分是浪费的。你用 Cursor 写代码,MCP 工具一调用,把整个项目文件往上下文里一灌。你的项目可能有五十个文件,但 AI 其实只需要看其中三四个。剩下的四十六个文件,全是无效消耗。你付了钱,AI 被分了心,两边都亏。
context-mode 盯上的就是这个窟窿。
我跟好几个做独立开发的朋友聊过这件事。他们每个月光 AI 编程工具的费用在两百到四百美金之间,其中有至少一半的调用量是被这些无效文件吃掉的。你说亏不亏。一个程序员花钱请 AI 帮忙写代码,结果 AI 花了一半的脑子在重读那些根本不需要的东西。
它做的事不复杂,但是真管用
context-mode 核心逻辑只有一句话:别让 AI 直接碰原始数据。
具体干了三件事。

第一件,虚拟沙盒。相当于在 AI 和你的项目文件之间加了一个数据门卫。AI 要查东西,先到这个门卫那里登记一下。门卫从你项目里精准捞出 AI 真正需要的那几行,扔给它。剩下的文件,看都不给看。79.3KB 的文件,一轮操作下来 Token 消耗直接降了 87.7%。
第二件,存档点。AI 写代码最烦的就是聊太久之后开始犯傻。主流 IDE 都有隐藏的上下文上限,代码量一上去,系统就会偷偷把你的历史对话给裁了。关键信息被裁掉之后,AI 就开始放飞自我。context-mode 的做法是,它监控你的每一次文件编辑,上下文快满的时候,自动帮你把关键信息浓缩成一个不到 2KB 的快照塞回去。AI 看到快照,等于看到了整个项目的历史。团队实测,这套机制把 AI 连续编程的有效时间从半小时撑到了三小时。
第三件,用代码思考。这个名听着有点技术,其实就是换了个思路。传统用法是你把所有文件丢给 AI,让它去逐行读、逐行分析。一百个文件,它就要读一百遍。context-mode 的思路反了过来:遇到要处理大量数据的时候,别让 AI 自己读,先让它写一个小脚本,脚本在本地跑完,把结果给它。AI 不用碰原始数据,只看最终结果。创始人自己的同事去参加 Kaggle 比赛,让 Claude 盯着三百组数据训练,模型为了确认进度,每五秒做一次全局检索,高配会员的 API 额度半小时烧掉 90%。换成这个范式之后,同样的事情只花了一点零头。
98% 不是吹的,是真算出来的

团队做了大量的实测。单文件处理上,Token 消耗差了 99.98%。综合长周期项目跑下来,整体成本就是降了 98%。
你取一万块的 AI 编程账单,用上它之后剩两百块。你自己品。
而且这个数据是手算得出来的。我自己接进去实测了一下午。之前一个中型项目,用 Claude Sonnet 改一轮代码大概吃掉二十万 Token,接入之后同样一轮不到四千。十几倍的差距,肉眼可见。你不需要看后台数据,账单上那个数字自己就会告诉你。
而且它不是只支持某一个模型。context-mode 是个 MCP 插件,已经把十五个主流平台的底层都适配好了。Cursor 能用,Claude 能用,Gemini 能用。微软、谷歌、Meta、字节的研发团队已经在用了。你不用换 IDE,也不用改工作流,挂上就行。
写这个项目的人有点意思

创始团队主力就两个人,跨国协作,一个在土耳其,一个在中国,靠 GitHub 写代码交流。
Mert Köseoğlu,土耳其人,十年全栈经验,给 OpenAI 当过技术顾问,之前在 Jotform、Planhat 这些数据平台做高级工程师。他应该是这个想法的起源。
孙逸诚,中国人,大二在读,之前进过数学物理强基计划全省前十八,独立开发过时序数据检索引擎,拿过知乎的 Agent 黑客松银奖。多平台适配是他做的。
一个大二学生,一个跨国老炮,写了个插件,帮 24 万开发者每个月省几百美金。
这种故事我永远爱看。
而且它说明了一件事:AI 编程工具的优化空间还大得离谱。过去一年所有人都在追更好的模型、更大的上下文窗口,没人认真想过一个问题:是不是我们的用法本身就是浪费。context-mode 做的事不新,就是改了个交互范式,效果就炸了。这比任何一个新模型的性价比都高。
你要不要试试?

context-mode 目前开源,GitHub 上直接拿。本地有个数据面板,能看当周 API 调用次数和拦截了多少无效读取。企业版还在内测,能生成安全审查和财务分析报告。
当然这不是说每个写代码的人都需要它。如果你一个月就花十几美金在 AI 编程上,装不装区别不大。但如果你像我一样重度依赖 AI 写代码,或者你们团队在用 AI 做开发,那这个插件的价值是实际算得出来的。省 98%,六个字就够了。
GitHub 上搜 context-mode,第一条就是。
试一下,反正是免费的。最坏的情况也就是你装了之后发现自己一个月确实没花多少钱在 AI 编程上。那也挺好。
夜雨聆风