5 月 22 号深夜,DeepSeek 发了一条推文,内容只有一句话:
"我们把优惠永久化了!🎉"
就这一句话,评论区炸了。2000 多条留言,最高赞是:"不是,1/4 和 2.5 折的区别是?"
区别大了。DeepSeek把2.5折写进官方文档这件事,本质上宣告了一件事:AI 推理的价格锚点从此被永久改写。

从"限时促销"到"永久正价"
2.5 折意味着什么?意味着随时可能恢复原价,是"活动"。开发者用着心里不踏实,每敲一行代码都得掂量:下个月会不会涨价?
1/4 原价 意味着什么?意味着写进了官方文档,是"定价"。你不用再担心突然恢复原价,可以放心把 V4-Pro 写进生产环境的配置文件里。
现在去翻 DeepSeek 的 API 定价页面,DeepSeek-V4-Pro 这一栏,"75% off"的标签还在,但它代表的不再是优惠倒计时,而是一个永久标记。
直接看数字:
| 缓存命中 | 缓存未命中 | 输出 | |
|---|---|---|---|
| V4-Pro(永久价) | $0.0036/百万 | $0.435/百万 | $0.87/百万 |
| V4-Flash | $0.0028/百万 | $0.14/百万 | $0.28/百万 |
换算成人民币,V4-Pro 缓存命中不到 3 分钱,输出 6 块钱一百万 token。V4-Flash 更狠,输出只要 2 块。
两个模型都支持 1M 上下文 + 384K 最大输出,这是半年前只有顶配旗舰才有的参数。
我算了笔账:这价格到底有多离谱
拿行业顶配来比:
| 模型 | 输出价格(每百万 token) |
|---|---|
| GPT-5.5 | $30 ≈ 204 元 |
| Claude Opus 4.7 | $25 ≈ 170 元 |
| DeepSeek-V4-Pro | $0.87 ≈ 6 元 |
V4-Pro 的输出价格,是 GPT-5.5 的 1/34。
这不叫价格战,这叫降维打击。

而且别忘了,对 AI Agent 来说,大部分请求走的是缓存命中。以 Claude Code 为例,缓存命中率能达到 96% 以上。按缓存命中的价格算——不到 3 分钱一百万 token。
一个月重度 Agent 开发下来,token 费用可能花不了你一杯咖啡的钱。
更值得关注的是,DeepSeek这次不是烧钱补贴。V4 系列用了全新的混合稀疏注意力架构,单 token 算力消耗只有上一代的 27%。成本是技术降下来的,不是靠 VC 的钱硬扛的。
对开发者意味着什么?
假设你接入了 V4-Pro 的 API 做一个 AI 编程助手。按照典型的 Agent 交互模式,每次对话大约消耗 50 万输入 token + 1 万输出 token,其中 90% 走缓存命中。
算一下:
缓存命中(45万 token):45 × $0.0036 ≈ $0.16 缓存未命中(5万 token):5 × $0.435 ≈ $2.18 输出(1万 token):1 × $0.87 ≈ $0.87
一次完整 Agent 对话,总成本约 $3.21,折合人民币不到 23 块钱。
同样的任务用 GPT-5.5,成本是 $150+。差了近 50 倍。
这就是为什么那些做 AI Agent 的开发者看到这条消息直接疯了。不是"便宜了",是商业模型直接变了。
不到一个月,降了四次
回头看 DeepSeek 这波操作的时间线:

4 月 24 日:V4 系列发布,MIT 协议开源,1M 上下文 + 384K 最大输出 4 月 25 日:V4-Pro 开启 2.5 折限时优惠,原定 5 月 5 日截止 4 月 26 日:缓存命中价格降至首发价 1/10,永久生效 4 月 28 日:2.5 折优惠延期到 5 月 31 日 5 月 22 日:2.5 折变正价,永久固定
不到一个月,降了四次。而且还没到底。
为什么敢这么定价?
不是资本烧钱。V4 系列用了全新的混合稀疏注意力架构,单 token 算力消耗只有上一代的 27%,KV 缓存降到 10%。推理成本是实打实降下来的。
梁文锋 说过:"我们只是按照自己的步调来做事,然后核算成本定价。不贴钱,也不赚取暴利。"
从定价来看,他做到了。而且官方文档里还提了一句:"下半年昇腾 950 超节点批量上市后,V4-Pro 还有进一步下调空间。"
价格还可能更低。
与此同时,DeepSeek 正在推进 700 亿人民币融资,估值约 450 亿美元。创始人梁文锋承诺继续走开源路线,不追求短期商业化。这个路线如果跑通,对整个 AI 行业的定价体系都是颠覆性的。
更关键的一个信号是:从限时 2.5 折到永久定价,中间只用了不到一个月。 这在 SaaS 行业几乎不可想象。通常价格调整至少经过季度评审、灰度测试、用户沟通,而 DeepSeek 直接用行动表态:技术成本降了多少,价格就降多少,没有中间商赚差价。
对开发者来说,这个 2.5 折现在已经不是"薅羊毛"了,是写在合同里的正价。你可以放心地在生产环境用它,算进每月的云成本预算里,不用每个月担心涨价。
最后
如果你还在用海外模型做开发,我建议你现在就打开 DeepSeek 的 API 文档,重新算一笔账。V4-Pro 支持 1M 上下文、384K 最大输出、JSON 模式、工具调用,这些能力放六个月前,你可能要花 30 倍的价格。
现在,不到一杯咖啡的钱。
DeepSeek把2.5折写进官方文档这个动作,信号很明确:AI 推理的"低价时代",不是昙花一现的促销活动,而是永久定价。当成本优势从"活动"变成"常态",整个行业的价格体系都会被迫重写。而对普通开发者来说,最大的红利就是:你可以用 30 分之一的价格,享受到半年前只有企业级客户才用得起的模型能力。
点赞👍 转发↗️ 推荐❤️ 收藏📌
你的每一次支持,都是我们坚持原创的最大动力
关注不迷路,带你穿透AI迷雾,看清产业真相
夜雨聆风