AI新智场 · 2026.06.09 周二 · 深度教程
📌 本文包含:
① context-mode 是什么?解决什么痛点?
② 原理拆解:三招把Token成本压到1%
③ 安装教程:从零到跑起来(含代码)
④ 效果对比:接入前后的真实数据
⑤ 企业版 Insights:6种角色各有看板

AI编程成本暴跌98%的秘密 · 图源 Unsplash

所有AI程序员都经历过的噩梦
你用Claude或Cursor写代码,应该遇到过这两个问题:
① Token太贵。Claude Pro $20/月、Opus级别的高级套餐$200/月,稍微复杂点的项目,一天就能烧完一周的额度。
② AI"失忆"。代码写到一半,AI突然忘了你之前定义的架构约束,开始瞎写。因为对话太长,模型丢弃了之前的信息。
36氪今天报道了一个开源项目 context-mode,用三个机制直接把这两个痛点干掉了。
📊 context-mode 核心数据
• GitHub Star:15,000+
• 接入开发者:24.3万+
• 适配平台:15个(Cursor、Claude、Gemini、Copilot、Kimi、Qwen等)
• 采用企业:微软、谷歌、Meta、字节、Stripe、NVIDIA、Supabase
• Token成本节省:最高99.98%
• AI记忆时长:30分钟 → 3小时

微软、谷歌、NVIDIA团队都在用
context-mode的核心思路:不让AI直接看原始数据,而是在本地建一个"防火墙",只把精炼后的结果喂给AI。
虚拟沙盒(Sandbox) — 文件和运行记录先存在本地,AI需要什么再帮它精准提取,不让海量原始数据进入上下文窗口。
效果:读取79.3KB文件,Token成本降低87.7%
存档点(Snapshot) — 实时监控每次文件编辑,当对话太长时,自动构建一个 <2KB 的"快照"注入AI,像游戏存档一样。
效果:连续编程有效时间从30分钟 → 3小时
用代码思考(Think in Code) — 不让模型逐行读文件,而是让它写一个"小程序"在本地跑完,只返回精炼结果。
效果:Token节省99.98%
📌 创始人Mert的原话
"大家喜欢把50个文件直接丢给大模型去'数'有多少个函数。这不仅慢,还极其浪费算力。正确做法是让LLM写一个统计脚本,只输出结果。一个脚本替代十几个昂贵的工具调用——这是所有AI编程平台都必须遵循的底层铁律。"

虚拟沙盒:AI不看过程,只看结果
context-mode是一个MCP协议插件,可以直接接入你现有的开发环境。不需要换IDE,不需要改工作流。
1前提条件
你需要有一个支持MCP协议的AI编程工具:
• Claude Desktop / Claude Code
• Cursor
• VS Code + Copilot
• Windsurf / Kimi / Qwen
2安装 context-mode
通过npm全局安装(推荐方式):
终端
# 全局安装 context-modenpm install -g context-mode
或者项目级安装:
# 项目级安装npm install --save-dev context-mode
3配置MCP连接
以 Claude Desktop 为例,编辑MCP配置文件:
claude_desktop_config.json
{ "mcpServers": { "context-mode": { "command": "npx", "args": ["-y", "context-mode"] } } }
⚠️ 配置文件路径:
Windows:%APPDATA%\Claude\claude_desktop_config.json
macOS:~/Library/Application Support/Claude/claude_desktop_config.json
4Cursor 用户配置
在项目根目录创建 .cursor/mcp.json:
{ "mcpServers": { "context-mode": { "command": "npx", "args": ["-y", "context-mode"] } } }
5重启并验证 ✅
重启你的AI编程工具后,在聊天框中输入:
/context-mode stats
如果配置成功,浏览器会弹出一个本地数据面板,显示:
• 本周API调用次数
• context-mode 拦截的无效数据读取次数
• Token节省百分比
🎉 恭喜,你已经成功接入!

本地数据面板:实时查看Token节省情况

Token成本从全量读取降到零头
一个真实的踩坑案例(团队成员孙逸诚分享):
参加Kaggle数据竞赛,把300组数据的训练任务交给Claude。Claude没写定时脚本,而是每隔5秒全局检索一次项目进度——半小时就把高级会员的API额度烧掉了90%。
如果接入context-mode,这种"死盯"行为会被沙盒直接拦截,Claude只需要在任务完成时看一眼最终结果。

Insights:6种角色各看各的数据
context-mode近期推出了企业服务 Insights($20/seat/月),通过同一个MCP端点,给6种角色提供不同的分析视角:
CTO · 投资回报
"AI投入到底在产出什么?" → 组织级健康评分、采纳率、质量等级
工程经理 · 团队效率
"谁卡住了?卡在哪?" → 卡点排名、持续错误追踪、拒绝量分析
安全总监 · 审计
"AI碰了哪些敏感文件?" → 密钥路径检测、破坏性命令拦截
FinOps · 成本
"钱花哪了?" → Token消耗趋势、每次提交成本、重试浪费
DevOps · 发布质量
"代码质量健康吗?" → 提交分类(feat/fix/refactor)、修复比
普通工程师 · 个人成长
"我表现怎么样?" → 生产力百分位、热点文件分析
💡 核心设计哲学
开源自带永远免费。本地插件是数据采集器,数据留在你电脑上,不发往云端。Insights是企业可选的付费分析层——生成Token后才开始转发结构化事件(工具名、文件路径、错误数),永远不传输Prompt内容或源代码。

4个国家、GitHub异步协作的跨国团队
Mert Köseoğlu(创始人):为OpenAI等企业提供技术顾问服务,10年+全栈/架构经验,前Countly、Planhat、Jotform高级工程师。
孙逸诚(核心开发者):团队中的中国面孔,大二在读,强基计划数学与物理全省前18名,独立开发过Temporal-RAG引擎,知乎全球A2A黑客松银奖。
· · ·
💬 你在用哪个AI编程工具?
选一个你最常用的,看看有多少人跟你一样 👇
评论区见 🙌
AI新智场
每天一篇,读懂AI与汽车
每周一至周五早8点更新 · 周末精选深度
数据来源:36氪 / 智能涌现 / context-mode 官网
开源地址:github.com/nicepkg/context-mode
夜雨聆风