乐于分享
好东西不私藏

国内 AI API 到底谁便宜?七家厂商价格价格横评

国内 AI API 到底谁便宜?七家厂商价格价格横评

DeepSeek V4 发了,GLM-5.1 上了,Qwen3.6 也不甘寂寞——国内各家旗舰模型集体换代,API 定价也跟着重新洗牌。

问题是:到底谁贵谁便宜?官网价、云平台转售价、缓存价、限时折扣价,一眼看过去全是数字,根本没法直接比。

这篇就把七家主要厂商的 API 定价拉齐到同一张表上。数据截至 2026 年 4 月 27 日,以各平台官网公示为准。

旗舰模型价格一览:差距比你想的大

先看各家”当家旗舰”的标准输入/输出单价(单位:元/百万 tokens):

厂商 / 模型
输入(¥/百万)
输出(¥/百万)
缓存命中(¥/百万)
DeepSeek V4-Flash官网直调
1
2
0.02
DeepSeek V4-Pro官网直调(限时2.5折)
原12
原24
0.025 原0.1
DeepSeek V4-Pro腾讯云转售
12
24
1
DeepSeek V4-Pro阿里云百炼
12
24
2.4
智谱 GLM-5.1官网 [0,32K)
6
24
1.3
智谱 GLM-5.1官网 [32K+)
8
28
2
智谱 GLM-5官网 [0,32K)
4
18
1
智谱 GLM-5.1腾讯云转售
6
24
1.3
阿里 Qwen3.6-Plus百炼直调
2
12
0.2 显式缓存
阿里 Qwen3.6-Max百炼直调 [≤128K]
9
54
腾讯混元 Hy3 Preview腾讯云
1.2
4
0.4
月之暗面 Kimi K2.6官网
6.5
27
1.1
字节豆包 Seed 2.0 Pro火山引擎 [0,32K]
3.2
16
0.64
MiniMax M2.7官网
2.1
8.4
0.42

注:DeepSeek V4-Pro 限时 2.5 折优惠截至 2026/05/05。GLM 缓存存储费限时免费。豆包 Seed 2.0 Pro 按输入长度阶梯计价,表中为 [0,32K] 档,超 32K 价格更高。

一眼看下来,价格差距确实大。光看输出价格:Qwen3.6-Max 要 54 元/百万 tokens,DeepSeek V4-Flash 只要 2 元——差了 27 倍。

即使跟其他厂商的旗舰比,V4-Flash 的价格也是碾压级的。腾讯混元 Hy3 Preview 算便宜的了,输出 4 元,V4-Flash 还是只要它的一半。

图源:Unsplash

官网直调 vs 云平台转售,价差不小

这次整理最明显的一个发现:同一个模型,走不同渠道,价格可以差几倍。

以 DeepSeek V4-Pro 为例:

官网直调(限时2.5折):输入 3 元,输出 6 元,缓存 0.025 元

腾讯云转售:输入 12 元,输出 24 元,缓存 1 元

阿里云百炼:输入 12 元,输出 24 元,缓存 2.4 元

腾讯云和阿里云卖的都是原价 12/24 元,没有跟进 DeepSeek 官方的 2.5 折促销。而且阿里云百炼的缓存命中价还要 2.4 元,比腾讯云的 1 元贵了一倍多。

那走云平台到底图什么?

发票。腾讯云和阿里云的开票流程成熟,企业认证后可以自助开增值税专票。而 DeepSeek 官网开票要企业实名,然后等 7 个工作日。月消费大、对账频率高的公司,这个效率差异是实打实的。

SLA 和服务保障。通过腾讯云或阿里云调用,出了问题有工单系统兜底。DeepSeek 官网的技术支持目前还比较轻量。

轻量级模型这边:DeepSeek V4-Flash 和 Qwen3.6-Plus 打价格战

不是所有场景都需要旗舰模型,很多日常任务用”次旗舰”就够了。这块的竞争也很激烈。

模型
输入
输出
缓存命中
DeepSeek V4-Flash
1
2
0.02
Qwen3.6-Plus
2
12
0.2
智谱 GLM-5
4
18
1
腾讯 Hy3 Preview
1.2
4
0.4

V4-Flash 的输入价是 Qwen3.6-Plus 的一半,输出价更是只有 Qwen 的 1/6。而且 V4-Flash 的缓存命中价 0.02 元/百万 tokens,这个数字几乎可以忽略不计了。

腾讯 Hy3 Preview 输入价比 V4-Flash 略贵,输出 4 元是 V4-Flash 的两倍,但考虑到腾讯云的企业服务体系和开票便利性,对成本不是极度敏感的团队来说,Hy3 也是个实用选项。

Qwen3.6-Plus 的另一个特色是 Batch 模式——Batch File 的输入只要 1 元,输出 6 元。如果你的场景是批量处理(比如大规模文档分析),Batch 模式能再省一半。

图源:Unsplash

缓存价格:真正跑起来之后的成本关键

很多人只看标准输入/输出价,忽略了缓存命中价格。但在实际业务里,上下文缓存命中率往往很高——尤其是多轮对话、长文档处理这类场景。缓存价格越低,实际成本越省。

缓存命中价对比(¥/百万 tokens):

V4-Flash:0.02 | V4-Pro(折扣):0.025 | Qwen3.6-Plus:0.2 | Hy3:0.4 | MiniMax M2.7:0.42 | 豆包 Seed 2.0 Pro:0.64 | Kimi K2.6:1.1 | GLM-5.1:1.3

DeepSeek 的缓存价格断崖式低。官方说法是”全系列模型,输入缓存命中的价格已降至首发价格的 1/10″。V4-Flash 的 0.02 元/百万 tokens,意味着在高缓存命中率的场景下,输入成本几乎可以忽略。

这一项,其他家暂时没有跟上。GLM-5.1 的缓存命中还要 1.3 元,是 V4-Flash 的 65 倍。

GLM 的阶梯定价:长输入要多花钱

智谱有个比较少见的设计:按输入长度分档定价。

GLM-5.1 输入长度在 32K 以内时,输入 6 元、输出 24 元。但一旦超过 32K,输入就变成 8 元、输出 28 元。涨幅大约 17-33%。

像 Agent 场景、长文档理解、代码分析这类需要大量上下文的任务,很容易超过 32K。如果你的场景经常超过这个阈值,智谱的实际成本会比看起来的贵不少。

同样的情况在 Qwen3.6-Max 上也有:128K 以内输入 9 元,超过 128K 就跳到 15 元,输出也从 54 元涨到 90 元。这种阶梯定价,用之前一定要估好自己的平均输入长度。

五个真实场景,各选谁

场景一:个人开发者轻量调用、日常写代码

→ DeepSeek V4-Flash。1 元 / 2 元的价格、缓存 0.02 元,跑 Agent 场景也不心疼。DeepSeek 官网直调即可,不用绕腾讯云或阿里云。

场景二:企业正式项目、需要开票合规

→ 腾讯云(Hy3 Preview 或 GLM-5.1 转售)或智谱官网。开票流程最省心,价格在可接受范围。腾讯混元 Hy3 性价比不错,智谱 GLM 稳定性好。

场景三:追求极限性能、不差钱

→ DeepSeek V4-Pro(趁 5 月 5 日前的 2.5 折窗口)。输入 3 元 + 输出 6 元 + 目前最强的 benchmark 成绩,这个性价比窗口过了就没了。

场景四:已绑定阿里云生态、批量处理

→ Qwen3.6-Plus Batch 模式。批量输入 1 元、输出 6 元,配合节省计划还能再打折。但单价确实高于 DeepSeek,锁定前先算账。

场景五:需要多厂商冗余、防单点故障

→ 主力 V4-Flash,兜底切 GLM-5 或 Hy3 Preview。DeepSeek 一旦限流或宕机,后两者可以快速顶上。发票分别走两个渠道。

图源:Unsplash

几个值得留意的坑

1. DeepSeek V4-Pro 的 2.5 折是限时的。优惠窗口截至 2026 年 5 月 5 日 23:59(北京时间)。之后恢复原价 12/24 元,跟云平台转售价一样。别按折扣价做长期成本预算。

2. 不同平台的”缓存”含义不一样。DeepSeek 用的是”上下文硬盘缓存”(自动触发),阿里是”显式缓存”(需要主动创建,创建本身也收费 2.5 元/百万 tokens),智谱的”缓存存储”目前限时免费。买之前看清楚是自动命中还是需要手动管理。

3. 阿里云节省计划的额度不结转。承诺月消费 5.3 折听着香,但月度额度用不完直接作废。用量波动大的业务,估不准就是浪费。

4. 豆包阶梯定价别忽略。豆包 Seed 2.0 Pro 按输入长度分三档:[0,32K] 输入 3.2 元、输出 16 元;(32K,128K] 涨到 4.8/24 元;(128K,256K] 再翻到 9.6/48 元。长上下文场景下成本可能翻三倍,选之前估好平均输入长度。

价格战还在加速

整理完这张表,最直观的感受是:DeepSeek 在价格维度上的领先幅度,比我之前以为的还要大。V4-Flash 的 1/2 元定价加上 0.02 元的缓存命中,实际跑起来的成本可能只有 GLM 或 Qwen 旗舰的十几分之一。

但价格不是唯一维度。开票效率、SLA、技术支持、生态兼容性,这些在企业场景里每一项都能决定你选谁。

这篇的数据截至 2026 年 4 月 27 日。以国内这个卷法,下个月再看可能又变了。建议收藏,定期回来对照。