2026-06-07|今日 GitHub AI 项目深度介绍
每天精选一个有启发价值的开源 AI 项目,仔细讲清楚它是什么、怎么用、为什么值得关注。
9router:让 AI 编程工具永不掉线的开源路由器
一站式接入 40+ AI 提供商、100+ 模型,内置 RTK Token 节省器,自动降级永不触发速率限制。
⭐ 16.5k | 🍴 2.5k | 📝 JavaScript | 📄 MIT | 🕐 今日活跃标签: ai-gateway · claude-code · cursor · free-ai · token-saver · llm-router · mcp
📌 项目背景
2026 年,AI 编程工具(Claude Code、Cursor、GitHub Copilot、Codex 等)已经成为开发者日常工作中不可或缺的一部分。但随之而来的问题是:
订阅配额浪费:每月 $20-50 的订阅额度,经常在月底还剩一大半没用完 速率限制打断工作流:正写到关键处,突然弹出「速率限制已达上限,请稍后再试」 工具输出消耗大量 Token: git diff、grep、ls等工具调用结果往往非常冗长,快速消耗配额多工具多账号管理混乱:同时用 Claude Code + Cursor + Copilot,每个工具都要单独配置 API Key
9router 就是这个痛点的一站式解决方案。它由 GitHub 开发者 decolua 于 2026 年 1 月发布,核心定位是:一个跑在本地的 AI 智能路由中间件,让所有 AI 编程工具接入同一个统一端点,自动在订阅/低价/免费提供商之间无缝切换,永不中断编码工作流。
项目发布仅 5 个月,已获得 16.5k Stars 和 2.5k Forks,被 CSDN、知乎、老苏的博客、knightli.com 等多个技术媒体深度报道,堪称 2026 年最受关注的 AI 基础设施开源项目之一。

🚀 核心功能
三层级自动降级容错请求失败时自动按「订阅层级 → 低价层级 → 免费层级」顺序切换。例如:Claude Code 订阅配额用尽后,自动切换到 GLM(¥0.6/1M Token)→ MiniMax(¥0.2/1M)→ Kiro AI 免费 Claude → OpenCode Free,全程零停机时间。
RTK Token 节省器(节省 20-40%)内置的 RTK(Request Tool Kit)模块自动识别和压缩
tool_result内容——这类内容通常包含大量冗余的结构化数据(如git diff输出、目录列表等),是 Token 消耗的主要来源。实测可减少单次请求 20-40% 的 Token 消耗,直接降低 API 成本。MITM 透明代理(无需修改工具配置)支持拦截硬编码端点的 AI 工具流量(如 GitHub Copilot、Claude Code 的内置端点),无需修改工具源码或配置,即可接入 9router 的路由能力。支持 Linux NSS DB 证书注入,适配 Chrome、Firefox、Snap 版浏览器。
多账号负载均衡支持单服务商配置多个账号,自动轮询账号、处理配额限制和速率限制,提升账号利用率和服务稳定性。例如同时配置 3 个 Claude Code 订阅账号,自动在它们之间轮询。
40+ 提供商、100+ 模型统一接入官方明确支持 40+ AI 提供商,覆盖:OpenAI、Anthropic、Google Gemini、AWS Bedrock、Azure AI、Vertex AI、智谱 GLM、MiniMax、阿里云百炼、腾讯混元、DeepSeek、Qwen 等。支持所有提供商的公开模型,同时支持用户自定义模型别名。
可视化 Web 仪表盘基于 React 19 开发的可视化控制台,运行在
http://localhost:20128,支持:提供商管理、连接测试、用量监控、配置修改、实时请求日志查看。无需手写配置文件,所有操作都可以通过界面完成。MCP 协议桥接支持 Model Context Protocol(MCP)桥接,适配下一代 AI 工具协议。可以将 MCP 服务器也接入 9router 的统一路由体系。
⚙️ 技术亮点
三层 SQLite 容错存储架构从低性能的
lowdbJSON 存储升级而来,按环境自动降级:优先使用better-sqlite3(需构建工具)→ 其次使用 Node.js 22.5+ 内置的node:sqlite→ 最后降级为 WASM 版的sql.js。全环境兼容,数据不丢失。这保证了即使在 Docker 容器、Cloudflare Worker 等受限环境中,配置和用量数据依然可靠持久化。OAuth 令牌刷新防竞争机制令牌刷新时采用飞行中请求缓存机制,避免多个并发请求同时触发令牌刷新,解决令牌刷新冲突问题。这是生产级 AI 网关必须处理但很多开源项目忽略的边界条件。
用量配额实时查询系统主动从 Gemini、GLM、MiniMax 等提供商的 API 查询实时用量和剩余配额,在配额耗尽前主动切换,避免超额调用触发限流。这是 9router 能实现「永不停歇」的关键技术之一。
🏗️ 工作原理(架构解析)
9router 基于 Next.js 16 应用架构开发,整体分为 5 层:
| 应用层 | |
| API 网关层 | /v1/chat/completions、/v1/audio/transcriptions、MCP 桥接等) |
| 请求处理层 | |
| 提供商适配层 | |
| 数据持久化层 |
请求处理流程:
AI 工具向 9router 的 OpenAI 兼容接口发起请求 请求处理层解析模型名称,匹配对应的服务商/账号组合 向目标服务商发起请求,若失败自动触发三层降级 请求过程中自动压缩 tool_result内容节省 Token将结果转换为 OpenAI 兼容格式返回给 AI 工具
👥 适用人群
高频使用 AI 编码工具的开发者:Cursor、Claude Code、Cline、GitHub Copilot 的重度用户,希望降低成本、提升稳定性 多 AI 服务商用户:同时使用多个 AI 模型,需要统一管理、降低成本 AI 应用开发者:需要开发兼容多模型的应用,不想重复适配不同厂商接口规范 个人/小团队:需要低成本搭建自己的 AI 网关,避免单一服务商故障导致服务中断 隐私敏感用户:希望使用本地模型(Ollama)+ 云端模型混合部署,数据不出本地网络
⚡ 快速上手
方式一:npm 全局安装(最简单)
# 全局安装npm install -g 9router# 启动控制台(会自动打开 http://localhost:20128)9router方式二:Docker 部署
docker run -d \ --name 9router \ -p 20128:20128 \ -v ~/9router-data:/data \ 9router/9router:latest连接免费提供商(无需注册):
打开控制台 http://localhost:20128进入「提供商」→ 连接 Kiro AI(免费 Claude 无限量)或 OpenCode Free(无需认证) 完成!
在 Claude Code / Cursor 中使用:
Endpoint: http://localhost:20128/v1API Key: 任意字符串(9router 不验证)📊 对比分析
| 编码工具适配 | |||
| 容错能力 | |||
| Token 优化 | |||
| 免费提供商支持 | |||
| 可视化控制台 | |||
| 部署方式 | |||
| 成本 |
数据来源:GitHub 官方 README、DeepWiki 架构分析、CSDN/知乎技术测评(2026 年 5 月)
🔗 相关链接
🌐 官方网站:https://9router.com 📦 GitHub 仓库:https://github.com/decolua/9router 📖 中文文档:https://github.com/decolua/9router/blob/master/README.zh-CN.md
fly的AI学习
夜雨聆风