9Router:让 AI 编程永不停机,还能省下 20-40% 的 Token
一个开源工具,连接 40+ AI 提供商和 100+ 模型,智能路由 + 自动降级,让你的 AI 编程助手既省钱又稳定
写在前面
如果你正在使用 Claude Code、Cursor、Cline 等 AI 编程工具,可能遇到过这些痛点:
配额用完了:月中刚过,Claude 的 API 额度就见底,只能干等月底重置
Token 烧得快:一个大项目的 git diff 就能吃掉几千 tokens,成本蹭蹭往上涨
服务不稳定:某个 API 突然挂了,手头的代码改到一半被迫中断
多账号管理麻烦:买了好几个服务的订阅,但每次都要手动切换配置
今天要介绍的 9Router,就是专门解决这些问题的开源项目。
9Router 是什么?
简单来说,9Router 是一个智能 AI 模型路由器,它站在你的 AI 编程工具和各种 AI 服务商之间,做三件事:
压缩 Token:自动识别并压缩工具输出(git diff、文件列表等),无损减少 20-40% 的输入 Token
智能降级:订阅服务 → 便宜 API → 免费模型,三层自动切换,确保永不断线
统一接口:一个端点接入 40+ 服务商、100+ 模型,无需反复修改配置
用一句话概括它的核心价值:Never stop coding. Save 20-40% tokens.
核心功能详解
1. RTK Token Saver:自动压缩,省钱不省质量
当你用 AI 工具处理代码时,很多输出其实有大量冗余信息。比如:
git diff 的重复行头
grep 结果的路径前缀
文件列表的目录结构
9Router 的 RTK(Real-Time Kompressor) 会自动检测这些模式,进行无损压缩后再发给 LLM。实测效果:
每次请求减少 20-40% 的输入 Token
不影响上下文质量,LLM 依然能正确理解
长期使用可节省大量 API 费用
2. 三层智能降级:从订阅到免费,无缝切换
9Router 设计了一套优先级系统:
第一层:订阅服务
优先使用你已付费的 Claude Code、Cursor、GitHub Copilot 等订阅服务,物尽其用。
第二层:便宜 API
当订阅额度用完,自动切换到低价 API(如 DeepSeek、GLM、MiniMax),成本约 $0.2-0.6/百万 tokens。
第三层:免费模型
如果预算紧张,还能降级到完全免费的选项:
Kiro AI:无限量使用 Claude 4.5、GLM-5、MiniMax
OpenCode Free:无需认证即可使用
Vertex AI:新账号送 $300 额度
这套机制确保你的编程工作永远不会因为配额耗尽而中断。
3. 实时配额追踪:精准掌控成本
Dashboard 提供直观的用量监控:
实时 Token 消耗统计
配额重置倒计时(5 小时/每日/每周周期)
成本估算和节省对比
使用趋势图表
你可以清楚地看到:这个月还剩多少额度、什么时候重置、用免费模型省了多少钱。
4. 格式自动转换:一个端点,所有工具
不同 AI 服务的 API 格式各不相同(OpenAI、Claude、Gemini、Cursor...),9Router 自动处理这些差异。
你只需:
把 CLI 工具的端点设为 http://localhost:20128/v1
在 Dashboard 复制 API Key
指定模型(如 kr/claude-sonnet-4.5)
之后无论用 Claude Code、Cline 还是 Cursor,都能无缝访问所有 40+ 服务商。
5. 多账号管理:负载均衡 + 自动故障转移
如果你有多个账号(比如几个 OpenRouter 账号),9Router 支持:
轮询模式:请求均匀分配到各账号
优先级模式:优先用完某个账号再切换
自动故障转移:某账号出错时立即切换到备用账号
支持的服务商(部分列表)
免费/OAuth 层:
Kiro AI(Claude 4.5 + GLM-5 + MiniMax 无限量)
OpenCode Free(无需认证)
Vertex AI(新账号 $300 额度)
付费 API(40+ 家): OpenRouter、GLM、MiniMax、OpenAI、Anthropic、Gemini、DeepSeek、Groq、xAI、Mistral、Perplexity、Together AI、Fireworks、Cerebras、Cohere、NVIDIA、SiliconFlow 等
订阅服务: Claude Code、Codex、GitHub Copilot、Cursor IDE
快速上手
安装
npm install -g 9router
9router
Dashboard 会自动打开:http://localhost:20128
配置步骤
连接免费服务商(推荐先用 Kiro AI 或 OpenCode Free 测试)
设置 CLI 工具:
端点:http://localhost:20128/v1
API Key:从 Dashboard 复制
模型:如 kr/claude-sonnet-4.5
开始编程:你的 AI 工具现在会通过 9Router 路由请求
部署选项
本地运行(默认):适合个人开发
VPS/云服务器:团队共享配置
Docker 容器:快速部署
Cloudflare Workers:边缘计算部署
适用场景
场景 1:预算有限的独立开发者
策略:免费层 + RTK 压缩
效果:零成本使用 Claude 4.5 级别的 AI 编程助手
场景 2:订阅用户想榨干每一分钱
策略:实时监控配额,快用完时自动降级到便宜 API
效果:月底不再干等重置,持续高效编程
场景 3:多工具用户
策略:一个端点配置,所有 CLI 工具共享
效果:Claude Code、Cursor、Cline 随意切换,无需重复配置
场景 4:企业团队
策略:VPS 部署 + 云同步配置
效果:团队成员共享路由策略,统一管理成本
场景 5:频繁遇到限流
策略:多账号负载均衡
效果:请求分散到多个账号,避免单点限流
技术实现
9Router 基于 Next.js 前端 + Node.js 后端构建,核心特性包括:
云同步:配置跨设备同步
请求日志:完整的调试模式
使用分析:消费趋势图表
自定义组合:创建个性化降级链
OAuth 自动刷新:无需手动维护 Token
定价模式
9Router 本身永久免费(开源项目),你只需为实际使用的 AI 服务付费。
Dashboard 显示的成本是估算值,用于对比使用免费模型 vs 付费模型的节省情况,不涉及 9Router 本身的收费。
总结
如果你是 AI 编程工具的重度用户,9Router 能帮你:
✅ 省钱:RTK 压缩减少 20-40% Token 消耗
✅ 稳定:三层降级确保永不断线
✅ 简化:一个端点管理所有服务商
✅ 透明:实时监控用量和成本
✅ 灵活:从免费到订阅,自由组合策略
项目地址:https://github.com/decolua/9router
你在用什么 AI 编程工具?遇到过配额不够用的问题吗?欢迎在评论区分享你的经验!
夜雨聆风