降价97.5%!国产AI正在把大模型打造成＂水电煤＂

6月3日凌晨，腾讯云智能体开发平台正式执行新价格——DeepSeek-V4系列模型调用价格大幅下调，最高降幅达97.5%。

5月22日，DeepSeek官方宣布V4-Pro永久降价75%，把限时折扣变成基准价；5月27日，小米MiMo-V2.5跟进，永久降价最高99%；6月2日，腾讯云宣布平台侧再砍一刀，将V4系列价格拉平至DeepSeek官方售价；6月3日零点，新价生效。

97.5%到底省了多少钱？

据腾讯云公告及IT之家核实，看具体数字，本次调价细节如下：

DeepSeek-V4-Pro：

推理输入：0.012元/千tokens → 0.003元/千tokens（↓75%）
推理输出：0.024元/千tokens → 0.006元/千千tokens（↓75%）
缓存命中：0.001元/千tokens → 0.000025元/千tokens（↓97.5%）

DeepSeek-V4-Flash：

•缓存命中：0.0002元/千tokens → 0.00002元/千tokens（↓90%）

腾讯云特别说明：本次调整仅涉及价格变更，模型服务能力保持不变。

以一个典型的编码智能体场景为例——每次请求携带50K tokens项目代码上下文加2K新指令，执行100次请求：

据DeepSeek官方定价数据及社区测算，V4-Pro的缓存命中价格仅为正常输入的约1/120。启用Prompt缓存后，100次请求的输入总成本从2.18美元降至约0.27美元，节省约87.6%。

如果换成RAG问答系统（日均1000次，30K输入含知识库，90%命中缓存），V4-Pro月成本约78美元，而同样场景下Claude Opus 4.7约1590美元，GPT-5.5约1815美元——差距超过20倍。

这不是"便宜一点"，这是量级差异。

两条路线：越用越贵 vs 越用越便宜

把视线拉远，全球大模型定价正在走向两个截然不同的方向。

海外那边，涨价是主旋律。据多家科技媒体报道，OpenAI的GPT-5.5输出价格达30美元/百万tokens，Claude Opus 4.7输出价格25美元/百万tokens。Anthropic新推出的Claude Mythos定价更高——25美元/百万输入tokens、125美元/百万输出tokens，被社区称为"给基础设施层客户准备的新档位"。

国内这边，DeepSeek V4-Pro输出价0.87美元/百万tokens，是GPT-5.5的约1/34；小米MiMo-V2.5 Pro直接对齐DeepSeek定价，且强调"永久有效"。

据证券时报报道，业内人士认为，腾讯云本次降价可能点燃中国AI云市场价格战，推动中小企业加速采用AI服务。

这不是巧合，而是两条底层逻辑的分野：

海外路线——高价支撑前沿研发，用高利润反哺下一代模型训练。目标客户是付得起钱的大型企业和专业团队。

国产路线——低价撬动规模效应，用海量用户和调用数据驱动模型迭代。目标是把AI变成像水电煤一样的基础设施。

短期看，各有各的思路，没有对错之分。但从OpenRouter最新周度数据来看，中国大模型周调用量已达11.13万亿tokens，连续五周超过美国阵营（4.24万亿tokens），差距持续拉大——价格优势正在转化为实实在在的用量优势。

为什么国产大模型能一直降？

价格战背后，不是烧钱补贴，而是技术驱动的成本下降。

第一，架构创新摊薄推理成本。据MiniMax及新民晚报报道，MiniMax M3采用自研稀疏注意力架构MSA，在100万上下文规模下单token计算量仅为上一代模型的约1/20。DeepSeek V4采用混合专家架构，1.6万亿参数中每次推理只激活部分专家，天然降低计算开销。

第二，开源生态降低迁移成本。DeepSeek V4发布即开源，小米MiMo也走开源路线。开源意味着开发者可以在自有环境部署，云厂商的竞争从"锁定用户"转向"比拼服务"，价格自然被压低。

第三，规模效应持续释放。据券商中国报道，腾讯控股6月2日股价大涨10.46%，创2021年1月以来单日涨幅纪录，总市值单日增长逾4100亿港元。资本市场押注的不是降价本身，而是降价带来的使用量爆发——调用越多，边际成本越低，又能继续降价。

这是一个正反馈飞轮：降价→用量增长→数据积累→模型优化→成本下降→继续降价。

对开发者意味着什么？

个人开发者：门槛归零。以前用GPT-5.5跑一周的编码Agent，成本可能上百美元。现在用DeepSeek V4-Pro，同等任务成本不到5美元。许多"试试看"的创意，从"算了吧"变成了"跑起来"。

创业团队：架构决策重新评估。据社区实测数据，V4-Pro在SWE-Bench Verified上得分80.6%，与Claude Opus 4.7的87.6%有差距，但输出价格仅1/29。对于大量重复性编码任务，代码审查、Bug修复、测试生成，这个性价比足以改变技术选型。

企业用户：多云策略成为刚需。腾讯云、阿里云、火山引擎都在接入国产开源模型，价格持续走低。但不同云厂商的缓存策略、上下文长度支持、智能体编排能力各有差异。选哪个？不是看谁更便宜，而是看谁更适合你的场景。

一个务实的建议：把"缓存命中率"作为核心指标来评估。V4-Pro的缓存命中价仅为正常输入的1/120，如果你的业务有大量重复上下文（RAG问答、长文档处理、代码Agent），缓存设计直接决定了成本天花板。

价格战的尽头是什么？

价格不可能无限下降。那么这一轮"普惠潮"的终局是什么？

短期（6-12个月）：价格战继续，更多云厂商跟进。核心模型调用价格趋近于零，竞争焦点转向智能体编排、知识库管理、私有化部署等增值服务。

中期（1-2年）：行业洗牌加速。没有架构创新能力的厂商，降价就是割肉；有技术底座的厂商，降价是进攻武器。最后活下来的，一定是那些能把推理成本持续压低的公司。

长期：大模型真正成为基础设施。就像今天没人整天关心一度电多少钱一样，未来开发者可能不再关心每百万tokens多少钱——因为成本已经低到不值得计算。真正决定竞争力的，是你基于大模型构建的智能体、工作流和数据飞轮。

那时候，价格战就没有意义了，因为竞争格局的战场已经换了。

核心观点：AI大模型定价正在把全球市场分成两个趋势，海外涨价做高端，国内降价做规模。这不是简单价格战，而是两种产业化路径的分野。国产"普惠路线"的底气来自架构创新和开源生态，正在把模型调用变成水电煤一样的基础设施。对开发者来说，当下的核心策略不是选最便宜的，而是学会利用缓存机制和多云策略，把成本优势转化为产品优势。

【免责声明】：本文内容结合媒体新闻和AI信息，进行整理创作，仅为作者个人理解，不代表任何官方观点或立场。