在重度依赖大模型辅助开发的场景里,开发者经常遇到两个硬件性阻碍:一是订阅配额消耗极快且容易触及调用限制;二是很多前端工具被绑定在单一的模型供应商上。
开源项目 9Router 是一个尝试解决这两个问题的本地代理网关。它的定位很明确:将 Claude Code、Codex、Cursor、Cline、Copilot、Antigravity 等开发工具的请求拦截下来,然后连接到来自 40 多个提供商的免费或平价 Claude/GPT/Gemini 接口上,辅以自动故障切换和输出压缩机制。

图源 Github
来自 40 多个提供商的免费 Claude/GPT/Gemini
通常情况下,我们在使用特定的前端 IDE 或 CLI 时,能选择的模型通道很有限。
9Router 在本地部署后,会提供一个标准的 OpenAI 兼容 API 接口,所有的开发工具只需要对接这一个接口,就可以在后端自由配置多达 40 种以上的模型。
重点是免费。

图源 Github | 支持的列表
相当于,可以把 Kiro、OpenCode 这些平台提供的免费 Claude/GPT 额度,或者是利用 Vertex 这些云厂商的测试额度,代理出来给日常开发用。
自动切换,限流、故障自动恢复
免费额度编码的瓶颈在于单一账号的限制。9Router 支持在后台配置一个由高到低的调用瀑布流(Combo)。
01 订阅池。优先消耗你的官方主账号。
02 廉价池。一旦检测到主账号配额耗尽或报错,系统静默切向 GLM 或 MiniMax 等低成本的备用模型。
03 免费池。最后由完全免费的接口进行兜底。
整个降级和跨账号的轮询(Round-robin)在代理层处理完毕,前端开发工具没有任何感知,也不用被迫停下手头的代码去换 Key。
RTK 压缩:砍掉 40% 的冗余上下文
除了开源截流,这套系统还提供了原生的节流模块。对于 Cursor 和 Claude Code 而言,当让它读取日志或执行 git diff 时,产生的无效信息会白白消耗大量 Token。
图源 Unsplash | 界面截图
9Router 默认开启的 RTK Token Saver 模块,会在请求上行之前对 Tool Result(工具输出)做一次智能截断或无损压缩。实测数据显示,这种中间层过滤能在不影响模型理解代码逻辑的前提下,平均为你省下 20%-40% 的 Token 用量。
使用注意
让工具负责格式翻译与压缩,让大模型单纯负责代码推理,这是一种相对健康的工作流分离思路。
这个方案会比Trae好,用本地代理把免费的大模型资源池化,非常值得。
夜雨聆风