乐于分享
好东西不私藏

中国AI的"独立日":DeepSeek V4开源,第一次不靠英伟达跑万亿参数大模型

中国AI的"独立日":DeepSeek V4开源,第一次不靠英伟达跑万亿参数大模型

4 月 24 日下午,DeepSeek 官宣了新一代旗舰模型 V4 预览版,同步开源。几个小时前,OpenAI 刚发布 GPT-5.5。两家隔空对决,全球 AI 圈沸腾。

但比模型参数更炸裂的,是技术报告里那句不起眼的话:

“我们在英伟达 GPU 和华为昇腾 NPU 两个平台上均验证了细粒度专家并行方案。”

翻译成人话:全球第一个万亿参数级顶尖大模型,第一次完全跑在英伟达 CUDA 生态之外。

这不是”兼容”,不是”也能跑”,是首发适配。核心代码从 CUDA 迁移到了华为自研的 CANN 框架。

这件事的分量,可能比模型本身更大。


先看模型:V4 到底有多强?

DeepSeek-V4 一次推出两个版本:

  • V4-Pro
    (旗舰版):总参数 1.6 万亿,激活参数 490 亿
  • V4-Flash
    (轻量版):总参数 2840 亿,激活参数 130 亿

两个版本都支持 100 万 token 超长上下文——相当于一次性读完一部百万字长篇小说,或者一整年的企业财务报表。

性能方面,官方数据显示:

  • 编程能力
    :V4-Pro 在 Agentic Coding 评测中拿下开源最佳,DeepSeek 内部已经用它替代了 Sonnet 4.5 作为主力编程工具,交付质量接近 Opus 4.6
  • 世界知识
    :大幅领先其他开源模型,仅稍逊于 Gemini-Pro-3.1
  • 数学/推理
    :超越所有已公开评测的开源模型,比肩顶级闭源模型

技术上最值得说的是一个叫”动态压缩注意力”的新机制。简单说,以前大模型处理长文本就像一个人试图同时记住 100 本书的内容——记不住、断片、丢细节。V4 通过把注意力机制分成”粗筛”和”精读”两步,让计算开销和显存占用大幅下降,百万级上下文从 PPT 卖点变成了真正可用的工程能力。(来源:DeepSeek 官方技术报告,2026-04-24)


再看适配:为什么”跑在昇腾上”这件事这么重要?

过去十几年,全球 AI 产业有一个公开的秘密:底层被英伟达锁死了。

英伟达的 GPU + CUDA 软件生态,就像 AI 界的 Windows + Intel——你不想用也得用,因为所有的框架、工具、教程都是基于它写的。全球大模型公司的训练和推理,几乎 100% 跑在英伟达的硬件上。

这意味着什么?意味着只要美国一纸禁令,中国 AI 公司的算力供应就可能被卡脖子。事实上,这正是过去几年反复发生的事。

DeepSeek V4 做的事情,是在技术层面证明了一条替代路径可行

  1. 华为昇腾 950
     已完成 V4 系列的推理适配,实测数据显示,8K 输入场景下单卡吞吐可达 4700 TPS
  2. 除了华为,寒武纪、海光、沐曦、摩尔线程、天数智芯等国产芯片也宣布支持 V4
  3. 智源研究院的 FlagOS 已在 8 款以上国产 AI 芯片上完成 V4-Flash 的全量适配

用一个比喻:如果说以前中国 AI 是租住在英伟达的房子里,那现在是第一次证明——自己盖的房子,住起来也没问题。(来源:华为官方公众号、C114 通信网、中国信通院,2026-04-24/25)


价格战也开打了

DeepSeek 这次不光技术猛,商业策略也够狠:

模型
API 定价(每百万 token)
V4-Flash 输入
0.2 元
V4-Flash 输出
1.0 元
V4-Pro 输入
2.0 元
V4-Pro 输出
8.0 元

V4-Pro 还在搞限时 2.5 折(到 5 月 5 日),百万 token 输入只要 0.5 元。

作为对比,GPT-5.5 的 API 定价是百万 token 输入 75 美元(约 540 元人民币),V4-Pro 的价格是它的 千分之一

更夸张的是,国家超算互联网已经在 4 月 26 日开放了 V4 的免费对话服务,登录超算互联网官网就能直接用。(来源:DeepSeek 官网、国家超算互联网,2026-04-24/26)


同一天,OpenAI 放出 GPT-5.5

就在 V4 发布前几个小时,OpenAI 发布了 GPT-5.5。

两家在同一天对决,市场反应很直接——GPU 概念股盘中直线拉升,海光信息大涨超 9%,寒武纪、摩尔线程等纷纷跟涨。

但有意思的是,市场涨的不是英伟达概念股,而是国产芯片概念股

这说明投资者看到了什么?不是 V4 比 GPT-5.5 强多少的问题,而是:中国大模型第一次不需要英伟达也能跑了,国产算力的商业价值被重新定价了。(来源:新浪财经、微博@烈焰童子,2026-04-24)


跟普通人有什么关系?

你可能会说:万亿参数、昇腾芯片,这些离我太远了。

其实不远。直接影响有三个:

1. AI 工具会越来越便宜

V4-Flash 百万 token 输入 0.2 元,这个价格意味着企业用 AI 的门槛大幅降低。你用的各种 AI 应用——智能客服、翻译工具、代码助手——背后的成本都会跟着降,最终你作为用户会受益。

2. 国产芯片崛起 = 就业机会

华为昇腾生态需要大量的适配工程师、应用开发者。如果你学的是计算机、电子工程相关专业,CANN 生态的岗位正在快速增长。

3. 百万字上下文 = 新的使用方式

以前 AI 一次只能看几千字,你需要自己拆分文档、总结要点、分段喂给它。现在一次塞 100 万字进去,让 AI 自己读完整本合同、整套代码库、全年财报。工作方式会因此改变。


行动建议

  • 想体验的
    :直接去 chat.deepseek.com 或国家超算互联网试用 V4,免费的
  • 搞开发的
    :API 已开放,改个 model_name 就能调用,趁 2.5 折赶紧试
  • 找工作的
    :关注华为昇腾、CANN 相关岗位,这个生态正在急速扩张
  • 做投资的
    :国产算力赛道的逻辑已经从”讲故事”变成了”有真实商业负载”,值得重新审视

关注「AI引路者」,每天用大白话帮你搞懂 AI。看完就能用。

📦 回复「AI模板」获取 30 个实用 Prompt 模板,直接复制就能用!