乐于分享
好东西不私藏

别急着喊"中国AI赢了",DeepSeek V4的论文里有句实话

别急着喊"中国AI赢了",DeepSeek V4的论文里有句实话

2025年初,R1 发布。

英伟达一天蒸发6000亿美金。华尔街慌了:原来不用堆显卡,也能做出好东西。

一年后,V4 来了。

没有发布会,没有直播,官网上线,公众号发文,完事。

英伟达的股价呢?纹丝不动。

同一个对手,同一条赛道,市场的反应为什么天差地别?


股价是投票器,投的是预期

R1 那次暴跌,本质是一场误伤。

市场以为 DeepSeek 证明了”算力不值钱”。

但一年过去,大家回过味来了。DeepSeek 确实能省卡,但它并没有让算力需求消失。

恰恰相反,模型越便宜,用的人越多,总消耗反而在涨。

这次 V4 出来,市场看的不是跑分。跑分再好,也是实验室数字。

市场看的是一句话。

论文里自己写的:训练中途崩溃、稳定性不足、芯片间通信速度未达预期。

你看,DeepSeek 把最难听的话,自己说出来了。

这句话的杀伤力很大。它等于告诉全世界:我们确实跑在了华为昇腾上,但这个”跑”字,前面要加很多定语。

英伟达的投资者不是傻子。他们看懂了。

CUDA 生态那堵墙,不是一夜之间能推倒的。DeepSeek 正在挖隧道,但隧道还没通。


迟到 15 个月,真正的硬仗不在算法

很多人以为 V4 跳票,是模型做不出来。

我一开始也这么猜。

但真相更硬。

V4 迟到的真正原因,是把整副牌桌,从英伟达搬到了华为。

CUDA 是什么?它不是一块芯片,是一套”专用操作系统”。全球 AI 行业的代码、工具、人才,全锁死在里面。

DeepSeek 现在做的是强行换心脏。而且手术是在清醒状态下做的。

论文里提到,推理速度提升了35倍。听着很猛。

但你仔细看,是”相比迁移初期”提升了35倍。

迁移初期有多慢?他没说。我也不敢猜。

这就像一个人从走路进化到骑车,速度翻了几十倍。但你别忘了,他原来开的是高铁。

CUDA 就是那条高铁轨道。

DeepSeek 真正牛的地方,不是做出了 V4。

是它证明了一件事:这条轨道,是可以换的。

黄仁勋怕的就是这个。不是怕少卖几张卡。是怕”必须用英伟达”这个共识,开始松动。

一旦松动,全球算力的定价权就会摇晃。

所以我说,V4 的战略意义,根本不在模型本身。

它是一本”越狱指南”。


招中文系学生,这个信号比跑分狠

公告里有个细节,我盯着看了很久。

DeepSeek 的 HR,开始频繁出现在北大中文系宿舍楼里。

不是招程序员。是招学生做人文数据标注。

让 AI 判断古诗是悲伤还是旷达。让 AI 分辨哪些文字有灵气,哪些只是堆砌。

这件事比任何跑分都更能说明问题。

以前的 DeepSeek,是典型的理科做题机器。数学、代码、逻辑,样样在线。

但一聊情感,就露馅。写出来的东西,对,但”没味儿”。

现在它在补课。补的是最难补的那门课。

我的判断很简单:AI 的上半场比的是智商,下半场比的是情商。

推理和代码,靠堆算力和数据就能追上来。各家差距会越来越小。

但语感、情绪、对人性幽微的理解,这些东西没有标准答案,也买不到现成数据。

而且你注意,招的是中文系,不是计算机系。

这说明 DeepSeek 没打算做”中国的 GPT”。

它想做的是”懂中文的 AI”。

GPT-5.4 和 Claude 再强,读到”春风又绿江南岸”,也只能分析词性和语法。

但那个”绿”字里藏着的一整个春天,只有中国人自己训练的模型,才真能懂。


荀子那句话,是说给所有人听的

文章结尾引了荀子。

“不诱于誉,不恐于诽,率道而行,端然正己。”

说实话,这种话放在别的公司身上,我会笑。

太装了。

但放在 DeepSeek 这里,我信。

你看看过去这半年他们经历了什么。

R1 核心作者被字节挖走。LLM 核心作者被腾讯挖走。V2 核心作者被小米千万年薪带走。

核心员工期权没有市场化定价,留人越来越吃力。

外面一堆人在喊:”DeepSeek 是不是凉了?”

他们一次都没回应。

然后周五,模型上线了。

没有倒计时,没有预热,没有媒体采访。就是官网更新,API 同步,开源模型挂到 HuggingFace。

这种”先做再说”的风格,在现在的 AI 圈子里太稀缺了。

大多数公司的剧本是:先开发布会造势,再讲故事融资,然后慢慢交付。

DeepSeek 是反过来的。

先做,开源,上线,然后才发公告。

我不知道他们最终能走到哪里。世界知识储备还追不上 Gemini,超长文本的细粒度检索还有差距,核心人才流失之后能不能守住那种”不急不躁”的研发文化,都是未知数。

但至少今天,我觉得他们配得上那句话。

不是”我们很厉害所以可以淡定”。

是”我们选择先做,再说话”。


别急着喊”中国 AI 赢了”。

V4 证明了一件事:没有 CUDA,我们也能跑。

但能不能跑得稳、跑得久,这才是下一局的赌局。

黄仁勋最怕的,从来都不是某款芯片的销量。

他最怕的是,越来越多的团队,开始偷看 DeepSeek 那本”越狱指南”。

当”必须用英伟达”变成”也可以用华为”的那一天,才是真正的游戏规则改变。

你说,这一天还有多远?