一句话:中转站不是技术创新,是套利生意。底层 95% 在跑同一份开源代码,真正赚钱的是「渠道差价 + 超卖 + 信息不对称」三件事。
这篇借一次团队亲历的「中转站跑路」事件,把这门生意从底层架构、盈利逻辑、灰色风险到中美形态差异完整盘一遍。
一、前两周,我们使用的中转站跑路了
前两周中午,我们打开一直在用的那家 AI 中转站,准备跑个 Claude 的小测试,base_url 直接返回 502。
刷新两次,控制台也登不上去;公众号一周没更新。团队群里一问,几个对接的同事前两天就发现「这家不对劲」——余额查不到、工单无人回、连官网首页都成了缓存版本。
损失小几万块,公司预算里不算大头,但事情不止这一桩。过去半年,我们和合作过的几家公司用过的中转站里,至少三家「悄无声息地不见了」:要么直接跑路,要么是上游突然封一批账号、连带把站里所有用户限到不能调用,要么是充值通道关停、客服失联。
这种事多了之后,问题回到我们身上:
- 我们每个月充进去的小几万,到底是怎么变成对方现金流的?
- 这门生意为什么能活、又为什么能突然死?
- 国内外都在做,形态一样吗?到底该不该用、该怎么用?
借这次跑路,把中转站这门生意从底层架构、盈利模式、壁垒、灰色风险到中美形态差异完整盘了一遍。
结论先说:
- 中转站不是技术创新,是套利生意。底层 95% 用开源
one-api/new-api二次开发,本质是「鉴权代理 + 协议归一 + 计费」三件事。 - 中国「中转站」和美国「AI Gateway」是两类生意——前者赚渠道差价 + 超卖 + 信息不对称,后者赚 SaaS 订阅与企业治理费。
- 真正的暴利来自超卖:同一个 ChatGPT Plus / 企业 API 账号通过负载均衡服务 5–10 个用户,毛利从 30% 拉到 70%。
- 核心壁垒是「上游渠道关系 + 下游流量」双边规模,不是技术。技术差异化窗口正在关闭。
- OpenRouter 是中美形态的中间态,2026 年初 ARR 约 $50M,半年 5x 增长(来源:Sacra)。

下面逐项展开。
二、技术原理:本质是反向代理 + 协议归一
2.1 一次请求的链路
用户的 SDK 不变,只换 base_url 和 api_key,剩下全是中转站在动手脚:

用户 SDK (OpenAI-compatible)
↓ base_url=中转站, key=sk-xxx
中转站网关
├─ 鉴权:校验 sk-xxx,扣 token 配额
├─ 路由:按渠道权重 / 成本 / 可用性选上游
├─ Key 替换:用站方持有的官方 Key 替代用户 Key
├─ 协议转换:Anthropic / Gemini / Bedrock 协议 → OpenAI 格式
└─ 转发到上游真实 API
↓
按上游响应反向回流,记录用量、计费、写日志
不复杂,但每一环都是赚钱点。
2.2 核心组件与开源实现
| 组件 | 作用 | 开源实现 |
|---|---|---|
| 协议适配器 | Anthropic / Gemini / Bedrock 协议转 OpenAI 格式 | one-api、new-api、LiteLLM |
| 多渠道路由 | 同一模型多账号池负载均衡 | new-api 的 channel 加权 |
| 配额计费 | token 计数 + 倍率定价 + 站内余额扣减 | one-api 的 quota 系统 |
| 故障转移 | 上游 429 / 5xx 自动切换备用渠道 | new-api、OpenRouter |
| 缓存 | 命中相同 prompt 跳过上游调用 | Cloudflare AI Gateway、Helicone |
| 观测 | 请求日志、成本看板、token 流向 | Helicone、Langfuse |
国内中转站底层基本就是几个开源项目的衍生:
- One API(
songquanpeng/one-api):国内 LLM API 管理鼻祖,一个二进制 + Docker 一键部署,支持十几家厂商。 - New API(
QuantumNous/new-api):基于 One API 二开,UI、计费、新模型适配速度更快,几乎所有商业中转站都在跑它的衍生版。 - Sub2API:专门做 ChatGPT Plus / Claude Pro 订阅账号的逆向工程,把 Web UI 包装成 OpenAI 格式 API。
- Metapi:聚合多个中转站为一个统一入口的「元中转」。
技术不是壁垒。任何人花一周都能搭出一个中转站,门槛在渠道和流量。
三、盈利模式:三笔钱 + 一个超卖引擎
3.1 收入侧:三笔钱
| 收入来源 | 机制 | 量级 |
|---|---|---|
| 访问门槛费 | 「1 RMB = 1 USD 额度」的汇率套利(实际人民币汇率 ~7.2,套利约 15%) | 大头 |
| 额度池浮存 | 低频用户充值后用不完,沉淀资金可滚动;高频用户被限速排队 | 中等 |
| 信息不透明费 | 用户无法验证请求实际走哪条通道,「站内额度单位」与真实计费脱钩 | 灰色 |
3.2 成本侧:三种渠道
| 渠道类型 | 成本特征 | 价格倍率(vs 官方) | 风险 |
|---|---|---|---|
| 官方 API 批量采购 | Azure OpenAI 企业合作 / 阿里云百炼批发 | 0.8–1.5x | 合规、低价空间小 |
| 订阅账号逆向(Sub2API) | $20/月 ChatGPT Plus 拆给多人 | 0.05–0.3x | 封号、限流、模型不一致 |
| 二级中转嫁接 | 从其他中转站再批发 | 看上游 | 故障无法追溯、责任真空 |
3.3 真正的利润引擎:超卖
同一个官方企业账号通过负载均衡服务 5–10 个用户,收入 ×5、成本不变,毛利从 30% 拉到 70%。
这是中转站「月入百万」的核心秘密。OpenAI / Anthropic 的企业账号有 RPM / TPM 配额,把这些配额「切片」卖给多个小用户,只要单用户调用量低于阈值,就感知不到限速。
这也解释了为什么会「突然不见了」:上游一旦风控收紧把账号封掉,超卖结构里所有用户同时断流。站方没有库存可救场,只能跑路。
四、灰色风险:四条红线
回到前两周那次跑路,我们冷静下来盘账,才意识到平时享受着低价、对四条风险几乎没有感知,但每一条都已经在行业里反复发生过:

- 模型替换:付的是 GPT-5 价格,后端给你接 DeepSeek / Qwen,价差几十倍,普通用户测不出来。
- 数据回传:中转站完整看到 prompt 和 response,包含代码、配置、客户数据。
- 跑路风险:充值制 + 个人 / 小团队主体,跑路成本极低。
- 支付链路:很多用第三方易支付,资金链条不透明。
知乎上有篇大规模采样测试《揭秘中转站:45% 假模型,9 个投毒,1 个偷币》,对国内中转站做过盲测,结论令人警觉。换句话说,便宜的代价不是「省钱」,而是把不确定性外包给了一个匿名团队。
五、核心壁垒:双边规模 + 稳定性,不是技术
技术既然不值钱,长期能做大的玩家,护城河在哪?
| 壁垒维度 | 内容 | 谁占优 |
|---|---|---|
| 上游渠道 | OpenAI / Anthropic 企业合作、Azure 全球账号池、稳定的逆向账号供给 | 头部老玩家 |
| 下游流量 | 开发者社区、二次分销网络、内容种草 | API2D、AiHubMix、OpenRouter |
| 稳定性 | 多渠道自动 failover、上游限流后无缝切换 | OpenRouter(数据驱动路由) |
| 合规与品牌 | 企业发票、SLA、数据合规、跑路风险低 | CloseAI、火山引擎、Azure |
| 产品矩阵 | 不只卖 token,配套客户端、Agent、Workflow 平台 | OpenRouter、Portkey |
关键洞察:技术差异化窗口正在关闭,真正能持续做大的玩家在向「AI 网关 + 数据护城河」演进。OpenRouter 现在每月处理 8.4T tokens、2.5M 用户,路由数据反过来训练自家智能路由——这是网络效应(来源:Sacra)。
六、中国主流玩家盘点
注:国内市场鱼龙混杂,知乎 / GitHub
awesome-ai-proxy列了上百家。下面只列有规模、有口碑、长期存活的代表,按定位分类。
6.1 综合型(GPT / Claude / Gemini 全覆盖)
| 平台 | 定位 | 价格倍率 | 特点 | 适合场景 |
|---|---|---|---|---|
| API2D | 早期国内代表 | 1.0–1.4x | 品牌老、模型上新慢 | 只用 GPT 系列的轻度用户 |
| AiHubMix | 文档 / 社区驱动 | 1.4x(GPT-5)偏高 | 中文文档好、社区活跃 | 入门个人开发者 |
| CloseAI | 中规中矩老牌 | 中等 | 稳定、有企业发票 | to B 项目 |
| 柏拉图(bltcy.ai) | 多模型聚合 | 中等 | 模型覆盖广 | 通用场景 |
| APIYI(apiyi.com) | 统一网关定位 | 中等 | 企业向 | 企业开发者 |
| 灵芽 API | 全模型直连主打 | 中低 | GPT / Claude / Gemini / Veo / Sora / nano-banana 都覆盖 | 多模型实验 |
| 白菜 GPT(baicaigpt.com) | 极致低价 | ~0.1x(1 元 = 1 美元额度) | 明显走逆向 / 超卖 | 实验玩具,不建议生产 |
| PoloAPI | 大规模采购 | ~0.3x | 主打官方价 30% | 重度调用 |
6.2 开源 / 自建工具
| 项目 | GitHub | 用途 |
|---|---|---|
| One API | songquanpeng/one-api |
自建中转站基础设施 |
| New API | QuantumNous/new-api |
One API 增强版,商业站普遍底座 |
| Sub2API | (多个 fork) | 订阅账号逆向工程 |
| Metapi | cita-777/metapi |
聚合多家中转站为一个 Key |
6.3 云厂商或聚合平台
不严格算中转站,但解决类似问题(多模型统一接口):
- 国内主流云厂商:基本都提供「自家大模型 + 上游模型代理」的一站式平台,本质是「中转 + 自家模型」。
- 聚合型 SaaS:把多家中转站再聚合成一个统一入口的「元中转」,形态接近 OpenRouter,但合规与稳定性差异大。
这些有合规、发票、SLA,价格不便宜但适合企业。
七、美国市场是另一回事:AI Gateway 不是中转站

美国市场没有「中转站赚差价」这回事,因为支付、网络、账号都不是问题。同一形态产品被叫做 AI Gateway / LLM Router,核心价值是企业级治理与可观测性。
7.1 主要玩家对比
| 平台 | 定位 | 商业模式 | 核心特点 | 适合场景 |
|---|---|---|---|---|
| OpenRouter | 多模型聚合路由 | 5.5% 平台费 + 0% 加价 | 400+ 模型、智能路由、最大流量、ARR ~$50M | 个人 / 中小团队多模型实验 |
| Helicone | 可观测性优先 + 网关 | 开源 + SaaS 订阅 | Rust 实现、P50 8ms 延迟、LLM 版 Datadog | 已有部署需要监控 |
| Portkey | 企业级治理网关 | SaaS 订阅 | 1600+ 模型、guardrails、虚拟 Key、审计 | 合规 / 受监管行业 |
| Cloudflare AI Gateway | 边缘网关 | 按用量计费 | 内置缓存、DLP、速率限制、不收平台费 | 已用 Cloudflare 的团队 |
| LiteLLM | 开源 SDK + 自托管网关 | 开源免费 + 企业版 | 100+ 模型 OpenAI 格式适配、Python 生态 | 自托管偏好 |
| Together / Replicate / Fireworks | 推理服务商 | 自建推理集群 + 开源模型 | 不是网关,是 OSS 模型托管 | 跑 Llama / Mixtral 等 |
| Anyscale | Ray 生态推理 | 企业服务 | 大规模推理基础设施 | 大型 ML 团队 |
7.2 OpenRouter 单独说
它是最值得研究的样本——因为是消费级 + 企业级 + 数据飞轮的结合:
- 2026 年初 ARR 约 $50M(vs 2025-10 的 $10M、2025-05 的 $5M),半年 5x 增长
- 月处理 8.4T tokens、2.5M 用户
- 商业模式:不加价、5.5% 平台费
- 数据飞轮:路由数据反哺路由算法,网络效应是核心壁垒
- 边缘架构:低延迟,资本开销极小
来源:Sacra OpenRouter Equity Research
7.3 中美形态对比
| 维度 | 中国「中转站」 | 美国「AI Gateway」 |
|---|---|---|
| 核心问题 | 网络 / 支付 / 账号 / 协议门槛 | 多模型治理 / 观测 / 可靠性 |
| 典型客户 | 个人开发者 + 中小团队 | 企业 + Production 团队 |
| 盈利模式 | 渠道差价 + 超卖 + 浮存 | SaaS 订阅 + 低比例平台费 |
| 典型毛利 | 30%–70%(含灰色) | 网关本身不挣大钱,靠流量规模 |
| 合规风险 | 高(数据 / 支付 / 跑路) | 低(公开商业) |
| 技术差异化 | 几乎没有,开源底座 | 有(路由算法、观测能力、企业治理) |
| 未来演进 | 向「正规网关 + 自有模型」靠拢 | 向「路由智能 + Agent 平台」演进 |
八、如果你也在企业里负责选型
回到那次跑路。我们这次损失小几万,在公司预算里能扛得住;但金额从来不是关键——合规、稳定性、安全的真实成本,远高于 token 差价本身。账要这么算:
- 面向 C 端用户的生产环境绝不用灰色中转站。模型替换 + 数据回传两条红线碰不得。to C 高频调用、prompt 包含真实用户数据和业务逻辑的场景,必须走合规通道。
- 内部 AI coding 场景可以用,前提是核心密钥与代码彻底分离。
.env/ 密钥管理服务托管 secret,中转站只看到业务代码本身。对很多公司而言,业务代码量大、零散且高度业务化,本身没多少「机密」含量——这是 AI coding 用中转站能落地的现实条件。 - 企业内部需要 AI 网关,但目的不是省钱。是统一计费 + 多模型路由 + 可观测性 + 防滥用。可以参考 Helicone / Portkey 的能力清单自建(new-api 起底座),或直接用国内云厂商一站式平台。
- 「中转站省钱」对企业是伪命题。合规、SLA、稳定性、数据安全的成本远高于 token 差价。
- 「数据飞轮」值得抄。内部多模型调用数据应该沉淀,反哺模型选型决策和 Prompt 优化——这才是真正的护城河,OpenRouter 已经验证过。
- 个人开发者 / 学习场景:可以用 OpenRouter 或正规中转站(CloseAI 这类有发票的),不要图便宜碰逆向通道。
至于我们那家跑路的中转站,余额暂时是要不回来了——就当交一笔行业研究的学费。下次再充钱前,我们大概会先问自己一句:
这个站,是把我们当客户,还是当配额池里的一片切片?
夜雨聆风