国内 AI API 到底谁便宜?七家厂商价格价格横评
DeepSeek V4 发了,GLM-5.1 上了,Qwen3.6 也不甘寂寞——国内各家旗舰模型集体换代,API 定价也跟着重新洗牌。
问题是:到底谁贵谁便宜?官网价、云平台转售价、缓存价、限时折扣价,一眼看过去全是数字,根本没法直接比。
这篇就把七家主要厂商的 API 定价拉齐到同一张表上。数据截至 2026 年 4 月 27 日,以各平台官网公示为准。
旗舰模型价格一览:差距比你想的大
先看各家”当家旗舰”的标准输入/输出单价(单位:元/百万 tokens):
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
注:DeepSeek V4-Pro 限时 2.5 折优惠截至 2026/05/05。GLM 缓存存储费限时免费。豆包 Seed 2.0 Pro 按输入长度阶梯计价,表中为 [0,32K] 档,超 32K 价格更高。
一眼看下来,价格差距确实大。光看输出价格:Qwen3.6-Max 要 54 元/百万 tokens,DeepSeek V4-Flash 只要 2 元——差了 27 倍。
即使跟其他厂商的旗舰比,V4-Flash 的价格也是碾压级的。腾讯混元 Hy3 Preview 算便宜的了,输出 4 元,V4-Flash 还是只要它的一半。
图源:Unsplash
官网直调 vs 云平台转售,价差不小
这次整理最明显的一个发现:同一个模型,走不同渠道,价格可以差几倍。
以 DeepSeek V4-Pro 为例:
官网直调(限时2.5折):输入 3 元,输出 6 元,缓存 0.025 元
腾讯云转售:输入 12 元,输出 24 元,缓存 1 元
阿里云百炼:输入 12 元,输出 24 元,缓存 2.4 元
腾讯云和阿里云卖的都是原价 12/24 元,没有跟进 DeepSeek 官方的 2.5 折促销。而且阿里云百炼的缓存命中价还要 2.4 元,比腾讯云的 1 元贵了一倍多。
那走云平台到底图什么?
发票。腾讯云和阿里云的开票流程成熟,企业认证后可以自助开增值税专票。而 DeepSeek 官网开票要企业实名,然后等 7 个工作日。月消费大、对账频率高的公司,这个效率差异是实打实的。
SLA 和服务保障。通过腾讯云或阿里云调用,出了问题有工单系统兜底。DeepSeek 官网的技术支持目前还比较轻量。
轻量级模型这边:DeepSeek V4-Flash 和 Qwen3.6-Plus 打价格战
不是所有场景都需要旗舰模型,很多日常任务用”次旗舰”就够了。这块的竞争也很激烈。
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V4-Flash 的输入价是 Qwen3.6-Plus 的一半,输出价更是只有 Qwen 的 1/6。而且 V4-Flash 的缓存命中价 0.02 元/百万 tokens,这个数字几乎可以忽略不计了。
腾讯 Hy3 Preview 输入价比 V4-Flash 略贵,输出 4 元是 V4-Flash 的两倍,但考虑到腾讯云的企业服务体系和开票便利性,对成本不是极度敏感的团队来说,Hy3 也是个实用选项。
Qwen3.6-Plus 的另一个特色是 Batch 模式——Batch File 的输入只要 1 元,输出 6 元。如果你的场景是批量处理(比如大规模文档分析),Batch 模式能再省一半。
图源:Unsplash
缓存价格:真正跑起来之后的成本关键
很多人只看标准输入/输出价,忽略了缓存命中价格。但在实际业务里,上下文缓存命中率往往很高——尤其是多轮对话、长文档处理这类场景。缓存价格越低,实际成本越省。
缓存命中价对比(¥/百万 tokens):
V4-Flash:0.02 | V4-Pro(折扣):0.025 | Qwen3.6-Plus:0.2 | Hy3:0.4 | MiniMax M2.7:0.42 | 豆包 Seed 2.0 Pro:0.64 | Kimi K2.6:1.1 | GLM-5.1:1.3
DeepSeek 的缓存价格断崖式低。官方说法是”全系列模型,输入缓存命中的价格已降至首发价格的 1/10″。V4-Flash 的 0.02 元/百万 tokens,意味着在高缓存命中率的场景下,输入成本几乎可以忽略。
这一项,其他家暂时没有跟上。GLM-5.1 的缓存命中还要 1.3 元,是 V4-Flash 的 65 倍。
GLM 的阶梯定价:长输入要多花钱
智谱有个比较少见的设计:按输入长度分档定价。
GLM-5.1 输入长度在 32K 以内时,输入 6 元、输出 24 元。但一旦超过 32K,输入就变成 8 元、输出 28 元。涨幅大约 17-33%。
像 Agent 场景、长文档理解、代码分析这类需要大量上下文的任务,很容易超过 32K。如果你的场景经常超过这个阈值,智谱的实际成本会比看起来的贵不少。
同样的情况在 Qwen3.6-Max 上也有:128K 以内输入 9 元,超过 128K 就跳到 15 元,输出也从 54 元涨到 90 元。这种阶梯定价,用之前一定要估好自己的平均输入长度。
五个真实场景,各选谁
场景一:个人开发者轻量调用、日常写代码
→ DeepSeek V4-Flash。1 元 / 2 元的价格、缓存 0.02 元,跑 Agent 场景也不心疼。DeepSeek 官网直调即可,不用绕腾讯云或阿里云。
场景二:企业正式项目、需要开票合规
→ 腾讯云(Hy3 Preview 或 GLM-5.1 转售)或智谱官网。开票流程最省心,价格在可接受范围。腾讯混元 Hy3 性价比不错,智谱 GLM 稳定性好。
场景三:追求极限性能、不差钱
→ DeepSeek V4-Pro(趁 5 月 5 日前的 2.5 折窗口)。输入 3 元 + 输出 6 元 + 目前最强的 benchmark 成绩,这个性价比窗口过了就没了。
场景四:已绑定阿里云生态、批量处理
→ Qwen3.6-Plus Batch 模式。批量输入 1 元、输出 6 元,配合节省计划还能再打折。但单价确实高于 DeepSeek,锁定前先算账。
场景五:需要多厂商冗余、防单点故障
→ 主力 V4-Flash,兜底切 GLM-5 或 Hy3 Preview。DeepSeek 一旦限流或宕机,后两者可以快速顶上。发票分别走两个渠道。
图源:Unsplash
几个值得留意的坑
1. DeepSeek V4-Pro 的 2.5 折是限时的。优惠窗口截至 2026 年 5 月 5 日 23:59(北京时间)。之后恢复原价 12/24 元,跟云平台转售价一样。别按折扣价做长期成本预算。
2. 不同平台的”缓存”含义不一样。DeepSeek 用的是”上下文硬盘缓存”(自动触发),阿里是”显式缓存”(需要主动创建,创建本身也收费 2.5 元/百万 tokens),智谱的”缓存存储”目前限时免费。买之前看清楚是自动命中还是需要手动管理。
3. 阿里云节省计划的额度不结转。承诺月消费 5.3 折听着香,但月度额度用不完直接作废。用量波动大的业务,估不准就是浪费。
4. 豆包阶梯定价别忽略。豆包 Seed 2.0 Pro 按输入长度分三档:[0,32K] 输入 3.2 元、输出 16 元;(32K,128K] 涨到 4.8/24 元;(128K,256K] 再翻到 9.6/48 元。长上下文场景下成本可能翻三倍,选之前估好平均输入长度。
价格战还在加速
整理完这张表,最直观的感受是:DeepSeek 在价格维度上的领先幅度,比我之前以为的还要大。V4-Flash 的 1/2 元定价加上 0.02 元的缓存命中,实际跑起来的成本可能只有 GLM 或 Qwen 旗舰的十几分之一。
但价格不是唯一维度。开票效率、SLA、技术支持、生态兼容性,这些在企业场景里每一项都能决定你选谁。
这篇的数据截至 2026 年 4 月 27 日。以国内这个卷法,下个月再看可能又变了。建议收藏,定期回来对照。
夜雨聆风