宝藏开源工具,AI模型免费用:9Router,免费接入 40+ 模型渠道,打破额度限制

在重度依赖大模型辅助开发的场景里，开发者经常遇到两个硬件性阻碍：一是订阅配额消耗极快且容易触及调用限制；二是很多前端工具被绑定在单一的模型供应商上。

开源项目 9Router 是一个尝试解决这两个问题的本地代理网关。它的定位很明确：将 Claude Code、Codex、Cursor、Cline、Copilot、Antigravity 等开发工具的请求拦截下来，然后连接到来自 40 多个提供商的免费或平价 Claude/GPT/Gemini 接口上，辅以自动故障切换和输出压缩机制。

图源 Github

来自 40 多个提供商的免费 Claude/GPT/Gemini

通常情况下，我们在使用特定的前端 IDE 或 CLI 时，能选择的模型通道很有限。

9Router 在本地部署后，会提供一个标准的 OpenAI 兼容 API 接口，所有的开发工具只需要对接这一个接口，就可以在后端自由配置多达 40 种以上的模型。

重点是免费。

图源 Github | 支持的列表

相当于，可以把 Kiro、OpenCode 这些平台提供的免费 Claude/GPT 额度，或者是利用 Vertex 这些云厂商的测试额度，代理出来给日常开发用。

自动切换，限流、故障自动恢复

免费额度编码的瓶颈在于单一账号的限制。9Router 支持在后台配置一个由高到低的调用瀑布流（Combo）。

01 订阅池。优先消耗你的官方主账号。

02 廉价池。一旦检测到主账号配额耗尽或报错，系统静默切向 GLM 或 MiniMax 等低成本的备用模型。

03 免费池。最后由完全免费的接口进行兜底。

整个降级和跨账号的轮询（Round-robin）在代理层处理完毕，前端开发工具没有任何感知，也不用被迫停下手头的代码去换 Key。

RTK 压缩：砍掉 40% 的冗余上下文

除了开源截流，这套系统还提供了原生的节流模块。对于 Cursor 和 Claude Code 而言，当让它读取日志或执行 git diff 时，产生的无效信息会白白消耗大量 Token。

图源 Unsplash | 界面截图

9Router 默认开启的 RTK Token Saver 模块，会在请求上行之前对 Tool Result（工具输出）做一次智能截断或无损压缩。实测数据显示，这种中间层过滤能在不影响模型理解代码逻辑的前提下，平均为你省下 20%-40% 的 Token 用量。

使用注意

维度	问题和限制
网络稳定性	免费提供商和第三方渠道的请求延迟通常大于直连官方。
维护成本	你需要在管理面板手动配置和追踪多达数十个渠道的 API。

让工具负责格式翻译与压缩，让大模型单纯负责代码推理，这是一种相对健康的工作流分离思路。

这个方案会比Trae好，用本地代理把免费的大模型资源池化，非常值得。