AI价格战卷到极致!DeepSeek V4凭什么敢放开百万字上下文?-夜雨聆风

AI价格战卷到极致!DeepSeek V4凭什么敢放开百万字上下文?

AI圈，又炸了。

近日，DeepSeek无预警发布新一代旗舰大模型V4系列，一口气推出两个版本：V4-Pro（旗舰版）和V4-Flash（轻量版）。

这一次，不是挤牙膏式的升级，而是直接把”百万字超长上下文”打成了全系标配，价格更是低到让同行睡不着觉。

百万字上下文，意味着什么？

简单说：以前你要把一份长文档拆成好几段喂给AI，现在直接整份丢进去，它能一口气读完。

100万Token约等于75万汉字——一次性处理整部《三体》三部曲、整年的财务年报、上百页的合同文本，都不需要分段。

这在以前是高端付费功能，现在是免费标配。

技术上整了什么活？

V4的核心突破在于一套全新的注意力架构：CSA（压缩稀疏注意力）+ HCA（重度压缩注意力）混合机制。

类比一下，就像相机的超广角镜头和微距长焦镜头同时工作——既能扫视全貌，又能聚焦细节。

效果很直接：V4-Pro单token推理计算量降至前代V3.2的27%，KV缓存占用仅剩10%；Flash版更狠，直接压缩到7%。

性能到底什么水平？

官方数据说几个重点：

代码能力：Codeforces评分3206分，超越GPT-5.4，妥妥的开源第一。LiveCodeBench Pass@1达93.5%，在开源领域没有对手。

数学推理：AIME 2026达到99.4%，超越所有已公开评测的开源模型。

智能体能力：比前代提升超过20分，已经成为DeepSeek内部员工编程的主力工具。

当然，和GPT-5、Gemini 3.1这些顶级闭源模型比，极限复杂任务仍有3到6个月的差距。但问题是——有多少人真的需要那个”极限”？

价格：便宜到离谱

这才是本次发布最让市场震动的部分。

V4-Flash：输入1元/百万Token，缓存命中仅0.02元

V4-Pro：输入12元/百万Token，限时3元

对比一下：GPT-5.5输入约5美元/百万Token，折合人民币约36元。DeepSeek Flash版便宜了多少倍？自己算。

更离谱的是，发布48小时内又连降两轮，缓存命中价格直接打到0.025元/百万Token。DeepSeek的降价速度，比有些手机的系统更新还频繁。

还有一个容易被忽略的信号

V4首次在官方技术报告里明确写了：验证了华为昇腾NPU和英伟达GPU双平台的表现。

翻译成人话就是：以后用国产芯片也能跑这个模型了。华为昇腾950下半年量产后，Pro版价格还会继续降。

这不只是一个技术适配问题，而是意味着——AI大模型从芯片到软件的全栈国产化，闭环正在形成。

写在最后

DeepSeek V4的出现，证明了两件事：

第一，开源模型已经能够比肩顶级闭源模型的绝大多数能力。过去”闭源=最强”的等式正在被打破。

第二，AI的使用成本正在以惊人的速度下降。当100万字上下文和顶级推理能力变得人人可用，AI普惠时代才真正开始。

接下来真正的问题是：当AI变得足够便宜和强大，你的行业会不会被重新定义？

END

2026年8月13-15日，第21届亚印展将在杭州举办，届时将汇聚更多行业精英，让我们共同期待！扫码预约参观门票！

扫码下方图片二维码，即可参与报名本届大会。

加入行业社群，内有惠普、奔图、晨光等一众知名打印机品牌，欢迎大家进群交流！

【如群满，加小编微信（MarxistJia）拽您进群】

点赞关注，为您带来更多办公行业相关资讯

往期推荐：