乐于分享
好东西不私藏

AI价格战卷到极致!DeepSeek V4凭什么敢放开百万字上下文?

AI价格战卷到极致!DeepSeek V4凭什么敢放开百万字上下文?

AI圈,又炸了。

近日,DeepSeek无预警发布新一代旗舰大模型V4系列,一口气推出两个版本:V4-Pro(旗舰版)和V4-Flash(轻量版)

这一次,不是挤牙膏式的升级,而是直接把”百万字超长上下文”打成了全系标配,价格更是低到让同行睡不着觉。

百万字上下文,意味着什么?

简单说:以前你要把一份长文档拆成好几段喂给AI,现在直接整份丢进去,它能一口气读完。

100万Token约等于75万汉字——一次性处理整部《三体》三部曲、整年的财务年报、上百页的合同文本,都不需要分段。

这在以前是高端付费功能,现在是免费标配

技术上整了什么活?

V4的核心突破在于一套全新的注意力架构:CSA(压缩稀疏注意力)+ HCA(重度压缩注意力)混合机制

类比一下,就像相机的超广角镜头和微距长焦镜头同时工作——既能扫视全貌,又能聚焦细节。

效果很直接:V4-Pro单token推理计算量降至前代V3.2的27%,KV缓存占用仅剩10%;Flash版更狠,直接压缩到7%。

性能到底什么水平?

官方数据说几个重点:

代码能力:Codeforces评分3206分,超越GPT-5.4,妥妥的开源第一。LiveCodeBench Pass@1达93.5%,在开源领域没有对手。

数学推理:AIME 2026达到99.4%,超越所有已公开评测的开源模型。

智能体能力:比前代提升超过20分,已经成为DeepSeek内部员工编程的主力工具。

当然,和GPT-5、Gemini 3.1这些顶级闭源模型比,极限复杂任务仍有3到6个月的差距。但问题是——有多少人真的需要那个”极限”?

价格:便宜到离谱

这才是本次发布最让市场震动的部分。

V4-Flash:输入1元/百万Token,缓存命中仅0.02元

V4-Pro:输入12元/百万Token,限时3元

对比一下:GPT-5.5输入约5美元/百万Token,折合人民币约36元。DeepSeek Flash版便宜了多少倍?自己算。

更离谱的是,发布48小时内又连降两轮,缓存命中价格直接打到0.025元/百万Token。DeepSeek的降价速度,比有些手机的系统更新还频繁。

还有一个容易被忽略的信号

V4首次在官方技术报告里明确写了:验证了华为昇腾NPU和英伟达GPU双平台的表现。

翻译成人话就是:以后用国产芯片也能跑这个模型了。华为昇腾950下半年量产后,Pro版价格还会继续降

这不只是一个技术适配问题,而是意味着——AI大模型从芯片到软件的全栈国产化,闭环正在形成。

写在最后

DeepSeek V4的出现,证明了两件事:

第一,开源模型已经能够比肩顶级闭源模型的绝大多数能力。过去”闭源=最强”的等式正在被打破

第二,AI的使用成本正在以惊人的速度下降。当100万字上下文和顶级推理能力变得人人可用,AI普惠时代才真正开始。

接下来真正的问题是:当AI变得足够便宜和强大,你的行业会不会被重新定义?

END

2026年8月13-15日,第21届亚印展将在杭州举办,届时将汇聚更多行业精英,让我们共同期待!扫码预约参观门票!

扫码下方图片二维码,即可参与报名本届大会。

加入行业社群,内有惠普、奔图、晨光等一众知名打印机品牌,欢迎大家进群交流!

【如群满,加小编微信(MarxistJia)拽您进群】

点赞关注,为您带来更多办公行业相关资讯

往期推荐:

定了!第21届亚洲打印复印技术及耗材展览会移师杭州,定档8月13-15日

邀请函 | 第21届亚洲打印复印技术及耗材展览会(亚印展ReChina),8月13-15日杭州见

2025珠海第20届亚印展圆满收官,专业观众再创新高

展后报告 | 珠海第19届亚印展,买家画像图表数据为您呈现

首日进馆23862人次!第18届亚印展在深圳盛大开幕