9router:让 AI 编程工具永不掉线的开源路由器

2026-06-07｜今日 GitHub AI 项目深度介绍

每天精选一个有启发价值的开源 AI 项目，仔细讲清楚它是什么、怎么用、为什么值得关注。

9router：让 AI 编程工具永不掉线的开源路由器

一站式接入 40+ AI 提供商、100+ 模型，内置 RTK Token 节省器，自动降级永不触发速率限制。

⭐ 16.5k | 🍴 2.5k | 📝 JavaScript | 📄 MIT | 🕐 今日活跃标签: ai-gateway · claude-code · cursor · free-ai · token-saver · llm-router · mcp

📌 项目背景

2026 年，AI 编程工具（Claude Code、Cursor、GitHub Copilot、Codex 等）已经成为开发者日常工作中不可或缺的一部分。但随之而来的问题是：

订阅配额浪费：每月 $20-50 的订阅额度，经常在月底还剩一大半没用完
速率限制打断工作流：正写到关键处，突然弹出「速率限制已达上限，请稍后再试」
工具输出消耗大量 Token：git diff、grep、ls 等工具调用结果往往非常冗长，快速消耗配额
多工具多账号管理混乱：同时用 Claude Code + Cursor + Copilot，每个工具都要单独配置 API Key

9router 就是这个痛点的一站式解决方案。它由 GitHub 开发者 decolua 于 2026 年 1 月发布，核心定位是：一个跑在本地的 AI 智能路由中间件，让所有 AI 编程工具接入同一个统一端点，自动在订阅/低价/免费提供商之间无缝切换，永不中断编码工作流。

项目发布仅 5 个月，已获得 16.5k Stars 和 2.5k Forks，被 CSDN、知乎、老苏的博客、knightli.com 等多个技术媒体深度报道，堪称 2026 年最受关注的 AI 基础设施开源项目之一。

🚀 核心功能

三层级自动降级容错请求失败时自动按「订阅层级 → 低价层级 → 免费层级」顺序切换。例如：Claude Code 订阅配额用尽后，自动切换到 GLM（¥0.6/1M Token）→ MiniMax（¥0.2/1M）→ Kiro AI 免费 Claude → OpenCode Free，全程零停机时间。
RTK Token 节省器（节省 20-40%）内置的 RTK（Request Tool Kit）模块自动识别和压缩 tool_result 内容——这类内容通常包含大量冗余的结构化数据（如 git diff 输出、目录列表等），是 Token 消耗的主要来源。实测可减少单次请求 20-40% 的 Token 消耗，直接降低 API 成本。
MITM 透明代理（无需修改工具配置）支持拦截硬编码端点的 AI 工具流量（如 GitHub Copilot、Claude Code 的内置端点），无需修改工具源码或配置，即可接入 9router 的路由能力。支持 Linux NSS DB 证书注入，适配 Chrome、Firefox、Snap 版浏览器。
多账号负载均衡支持单服务商配置多个账号，自动轮询账号、处理配额限制和速率限制，提升账号利用率和服务稳定性。例如同时配置 3 个 Claude Code 订阅账号，自动在它们之间轮询。
40+ 提供商、100+ 模型统一接入官方明确支持 40+ AI 提供商，覆盖：OpenAI、Anthropic、Google Gemini、AWS Bedrock、Azure AI、Vertex AI、智谱 GLM、MiniMax、阿里云百炼、腾讯混元、DeepSeek、Qwen 等。支持所有提供商的公开模型，同时支持用户自定义模型别名。
可视化 Web 仪表盘基于 React 19 开发的可视化控制台，运行在 http://localhost:20128，支持：提供商管理、连接测试、用量监控、配置修改、实时请求日志查看。无需手写配置文件，所有操作都可以通过界面完成。
MCP 协议桥接支持 Model Context Protocol（MCP）桥接，适配下一代 AI 工具协议。可以将 MCP 服务器也接入 9router 的统一路由体系。

⚙️ 技术亮点

三层 SQLite 容错存储架构从低性能的 lowdb JSON 存储升级而来，按环境自动降级：优先使用 better-sqlite3（需构建工具）→ 其次使用 Node.js 22.5+ 内置的 node:sqlite → 最后降级为 WASM 版的 sql.js。全环境兼容，数据不丢失。这保证了即使在 Docker 容器、Cloudflare Worker 等受限环境中，配置和用量数据依然可靠持久化。
OAuth 令牌刷新防竞争机制令牌刷新时采用飞行中请求缓存机制，避免多个并发请求同时触发令牌刷新，解决令牌刷新冲突问题。这是生产级 AI 网关必须处理但很多开源项目忽略的边界条件。
用量配额实时查询系统主动从 Gemini、GLM、MiniMax 等提供商的 API 查询实时用量和剩余配额，在配额耗尽前主动切换，避免超额调用触发限流。这是 9router 能实现「永不停歇」的关键技术之一。

🏗️ 工作原理（架构解析）

9router 基于 Next.js 16 应用架构开发，整体分为 5 层：

层级	功能说明
应用层	React 19 可视化 Web 仪表盘，支持提供商管理、连接测试、用量监控
API 网关层	暴露 OpenAI 兼容的 REST 接口（`/v1/chat/completions`、`/v1/audio/transcriptions`、MCP 桥接等）
请求处理层	模型别名解析、请求格式转换、三层降级逻辑调度、多账号负载均衡、Token 压缩优化
提供商适配层	针对不同 AI 服务商实现专用执行器，支持 OAuth 令牌自动刷新、用量配额查询、服务商特定错误重试
数据持久化层	三层 SQLite 降级存储，保障不同环境下的数据可用性

请求处理流程：

AI 工具向 9router 的 OpenAI 兼容接口发起请求
请求处理层解析模型名称，匹配对应的服务商/账号组合
向目标服务商发起请求，若失败自动触发三层降级
请求过程中自动压缩 tool_result 内容节省 Token
将结果转换为 OpenAI 兼容格式返回给 AI 工具

👥 适用人群

高频使用 AI 编码工具的开发者：Cursor、Claude Code、Cline、GitHub Copilot 的重度用户，希望降低成本、提升稳定性
多 AI 服务商用户：同时使用多个 AI 模型，需要统一管理、降低成本
AI 应用开发者：需要开发兼容多模型的应用，不想重复适配不同厂商接口规范
个人/小团队：需要低成本搭建自己的 AI 网关，避免单一服务商故障导致服务中断
隐私敏感用户：希望使用本地模型（Ollama）+ 云端模型混合部署，数据不出本地网络

⚡ 快速上手

方式一：npm 全局安装（最简单）

# 全局安装npm install -g 9router# 启动控制台（会自动打开 http://localhost:20128）9router

方式二：Docker 部署

docker run -d \  --name 9router \  -p 20128:20128 \  -v ~/9router-data:/data \  9router/9router:latest

连接免费提供商（无需注册）：

打开控制台 http://localhost:20128
进入「提供商」→ 连接 Kiro AI（免费 Claude 无限量）或 OpenCode Free（无需认证）
完成！

在 Claude Code / Cursor 中使用：

Endpoint: http://localhost:20128/v1API Key: 任意字符串（9router 不验证）

📊 对比分析

对比维度	9router	lushadavey/ai-gateway	直接订阅单一服务商
编码工具适配	专为 AI 编码工具优化，支持 MITM 代理拦截硬编码端点	通用场景设计，硬编码端点的工具需手动修改配置	无
容错能力	三层自动降级 + 多账号负载均衡	简单失败重试，无多层降级	无
Token 优化	内置 RTK Token 节省器，节省 20-40%	无	无
免费提供商支持	Kiro AI、OpenCode Free 等，无需注册	部分支持	无
可视化控制台	React 19 仪表盘，开箱即用	需额外对接监控系统	各服务商单独控制台
部署方式	本地 / Docker / Cloudflare Worker 三种	通常仅支持自部署	SaaS
成本	免费开源（MIT），可接入免费模型	免费开源	$20-50/月/工具

数据来源：GitHub 官方 README、DeepWiki 架构分析、CSDN/知乎技术测评（2026 年 5 月）

🔗 相关链接

🌐 官方网站：https://9router.com
📦 GitHub 仓库：https://github.com/decolua/9router
📖 中文文档：https://github.com/decolua/9router/blob/master/README.zh-CN.md

fly的AI学习