国内 AI API 到底谁便宜?七家厂商价格价格横评-夜雨聆风

国内 AI API 到底谁便宜?七家厂商价格价格横评

DeepSeek V4 发了，GLM-5.1 上了，Qwen3.6 也不甘寂寞——国内各家旗舰模型集体换代，API 定价也跟着重新洗牌。

问题是：到底谁贵谁便宜？官网价、云平台转售价、缓存价、限时折扣价，一眼看过去全是数字，根本没法直接比。

这篇就把七家主要厂商的 API 定价拉齐到同一张表上。数据截至 2026 年 4 月 27 日，以各平台官网公示为准。

旗舰模型价格一览：差距比你想的大

先看各家”当家旗舰”的标准输入/输出单价（单位：元/百万 tokens）：

厂商 / 模型	输入(¥/百万)	输出(¥/百万)	缓存命中(¥/百万)
DeepSeek V4-Flash官网直调	1	2	0.02
DeepSeek V4-Pro官网直调（限时2.5折）	3 原12	6 原24	0.025 原0.1
DeepSeek V4-Pro腾讯云转售	12	24	1
DeepSeek V4-Pro阿里云百炼	12	24	2.4
智谱 GLM-5.1官网 [0,32K)	6	24	1.3
智谱 GLM-5.1官网 [32K+)	8	28	2
智谱 GLM-5官网 [0,32K)	4	18	1
智谱 GLM-5.1腾讯云转售	6	24	1.3
阿里 Qwen3.6-Plus百炼直调	2	12	0.2 显式缓存
阿里 Qwen3.6-Max百炼直调 [≤128K]	9	54	—
腾讯混元 Hy3 Preview腾讯云	1.2	4	0.4
月之暗面 Kimi K2.6官网	6.5	27	1.1
字节豆包 Seed 2.0 Pro火山引擎 [0,32K]	3.2	16	0.64
MiniMax M2.7官网	2.1	8.4	0.42

注：DeepSeek V4-Pro 限时 2.5 折优惠截至 2026/05/05。GLM 缓存存储费限时免费。豆包 Seed 2.0 Pro 按输入长度阶梯计价，表中为 [0,32K] 档，超 32K 价格更高。

一眼看下来，价格差距确实大。光看输出价格：Qwen3.6-Max 要 54 元/百万 tokens，DeepSeek V4-Flash 只要 2 元——差了 27 倍。

即使跟其他厂商的旗舰比，V4-Flash 的价格也是碾压级的。腾讯混元 Hy3 Preview 算便宜的了，输出 4 元，V4-Flash 还是只要它的一半。

图源：Unsplash

官网直调 vs 云平台转售，价差不小

这次整理最明显的一个发现：同一个模型，走不同渠道，价格可以差几倍。

以 DeepSeek V4-Pro 为例：

官网直调（限时2.5折）：输入 3 元，输出 6 元，缓存 0.025 元

腾讯云转售：输入 12 元，输出 24 元，缓存 1 元

阿里云百炼：输入 12 元，输出 24 元，缓存 2.4 元

腾讯云和阿里云卖的都是原价 12/24 元，没有跟进 DeepSeek 官方的 2.5 折促销。而且阿里云百炼的缓存命中价还要 2.4 元，比腾讯云的 1 元贵了一倍多。

那走云平台到底图什么？

发票。腾讯云和阿里云的开票流程成熟，企业认证后可以自助开增值税专票。而 DeepSeek 官网开票要企业实名，然后等 7 个工作日。月消费大、对账频率高的公司，这个效率差异是实打实的。

SLA 和服务保障。通过腾讯云或阿里云调用，出了问题有工单系统兜底。DeepSeek 官网的技术支持目前还比较轻量。

轻量级模型这边：DeepSeek V4-Flash 和 Qwen3.6-Plus 打价格战

不是所有场景都需要旗舰模型，很多日常任务用”次旗舰”就够了。这块的竞争也很激烈。

模型	输入	输出	缓存命中
DeepSeek V4-Flash	1	2	0.02
Qwen3.6-Plus	2	12	0.2
智谱 GLM-5	4	18	1
腾讯 Hy3 Preview	1.2	4	0.4

V4-Flash 的输入价是 Qwen3.6-Plus 的一半，输出价更是只有 Qwen 的 1/6。而且 V4-Flash 的缓存命中价 0.02 元/百万 tokens，这个数字几乎可以忽略不计了。

腾讯 Hy3 Preview 输入价比 V4-Flash 略贵，输出 4 元是 V4-Flash 的两倍，但考虑到腾讯云的企业服务体系和开票便利性，对成本不是极度敏感的团队来说，Hy3 也是个实用选项。

Qwen3.6-Plus 的另一个特色是 Batch 模式——Batch File 的输入只要 1 元，输出 6 元。如果你的场景是批量处理（比如大规模文档分析），Batch 模式能再省一半。

图源：Unsplash

缓存价格：真正跑起来之后的成本关键

很多人只看标准输入/输出价，忽略了缓存命中价格。但在实际业务里，上下文缓存命中率往往很高——尤其是多轮对话、长文档处理这类场景。缓存价格越低，实际成本越省。

缓存命中价对比（¥/百万 tokens）：

DeepSeek 的缓存价格断崖式低。官方说法是”全系列模型，输入缓存命中的价格已降至首发价格的 1/10″。V4-Flash 的 0.02 元/百万 tokens，意味着在高缓存命中率的场景下，输入成本几乎可以忽略。

这一项，其他家暂时没有跟上。GLM-5.1 的缓存命中还要 1.3 元，是 V4-Flash 的 65 倍。

GLM 的阶梯定价：长输入要多花钱

智谱有个比较少见的设计：按输入长度分档定价。

GLM-5.1 输入长度在 32K 以内时，输入 6 元、输出 24 元。但一旦超过 32K，输入就变成 8 元、输出 28 元。涨幅大约 17-33%。

像 Agent 场景、长文档理解、代码分析这类需要大量上下文的任务，很容易超过 32K。如果你的场景经常超过这个阈值，智谱的实际成本会比看起来的贵不少。

同样的情况在 Qwen3.6-Max 上也有：128K 以内输入 9 元，超过 128K 就跳到 15 元，输出也从 54 元涨到 90 元。这种阶梯定价，用之前一定要估好自己的平均输入长度。

五个真实场景，各选谁

场景一：个人开发者轻量调用、日常写代码

→ DeepSeek V4-Flash。1 元 / 2 元的价格、缓存 0.02 元，跑 Agent 场景也不心疼。DeepSeek 官网直调即可，不用绕腾讯云或阿里云。

场景二：企业正式项目、需要开票合规

→ 腾讯云（Hy3 Preview 或 GLM-5.1 转售）或智谱官网。开票流程最省心，价格在可接受范围。腾讯混元 Hy3 性价比不错，智谱 GLM 稳定性好。

场景三：追求极限性能、不差钱

→ DeepSeek V4-Pro（趁 5 月 5 日前的 2.5 折窗口）。输入 3 元 + 输出 6 元 + 目前最强的 benchmark 成绩，这个性价比窗口过了就没了。

场景四：已绑定阿里云生态、批量处理

→ Qwen3.6-Plus Batch 模式。批量输入 1 元、输出 6 元，配合节省计划还能再打折。但单价确实高于 DeepSeek，锁定前先算账。

场景五：需要多厂商冗余、防单点故障

→ 主力 V4-Flash，兜底切 GLM-5 或 Hy3 Preview。DeepSeek 一旦限流或宕机，后两者可以快速顶上。发票分别走两个渠道。

图源：Unsplash

几个值得留意的坑

1. DeepSeek V4-Pro 的 2.5 折是限时的。优惠窗口截至 2026 年 5 月 5 日 23:59（北京时间）。之后恢复原价 12/24 元，跟云平台转售价一样。别按折扣价做长期成本预算。

2. 不同平台的”缓存”含义不一样。DeepSeek 用的是”上下文硬盘缓存”（自动触发），阿里是”显式缓存”（需要主动创建，创建本身也收费 2.5 元/百万 tokens），智谱的”缓存存储”目前限时免费。买之前看清楚是自动命中还是需要手动管理。

3. 阿里云节省计划的额度不结转。承诺月消费 5.3 折听着香，但月度额度用不完直接作废。用量波动大的业务，估不准就是浪费。

4. 豆包阶梯定价别忽略。豆包 Seed 2.0 Pro 按输入长度分三档：[0,32K] 输入 3.2 元、输出 16 元；(32K,128K] 涨到 4.8/24 元；(128K,256K] 再翻到 9.6/48 元。长上下文场景下成本可能翻三倍，选之前估好平均输入长度。

价格战还在加速

整理完这张表，最直观的感受是：DeepSeek 在价格维度上的领先幅度，比我之前以为的还要大。V4-Flash 的 1/2 元定价加上 0.02 元的缓存命中，实际跑起来的成本可能只有 GLM 或 Qwen 旗舰的十几分之一。

但价格不是唯一维度。开票效率、SLA、技术支持、生态兼容性，这些在企业场景里每一项都能决定你选谁。

这篇的数据截至 2026 年 4 月 27 日。以国内这个卷法，下个月再看可能又变了。建议收藏，定期回来对照。