DeepSeek的创始人梁文锋,曾经定过三条铁律。
不接受外部融资。
不稀释股权。
不被任何人的商业化时间表绑架。
这三条规矩,他守了将近三年。
三年里,DeepSeek从一个实验室项目,一路做到全球最强的开源大模型。V2掀起价格战,V3震惊硅谷,R1登上《自然》封面,V4成为首个不依赖英伟达的国产大模型。
三年里,无数投资人踏破门槛。美元基金、国资背景、互联网战投,排着队想给他送钱。
他一律不见。
然后,上周。消息爆出来了。
DeepSeek启动首轮外部融资,目标最高500亿人民币。
梁文锋自己掏了200亿。
01
先看看这500亿是怎么分布的。
消息来自The Information和金融时报,多家中外媒体跟进报道。虽然DeepSeek官方还没有正式回应,但从各方的信息交叉验证来看,轮廓已经相当清晰。
梁文锋个人出资200亿,占40%。这是最让人意外的部分。一个创始人,在公司首轮外部融资中自掏腰包200亿,这在全球科技史上都极为罕见。要知道梁文锋的全部身家也就1846亿左右,这相当于他把个人资产的十分之一以上押了进去。
国家集成电路产业投资基金(大基金)洽谈领投,预计成为第二大股东。注意,这是大基金第一次直接投资大模型公司。在此之前,大基金的投资方向一直是芯片制造和半导体设备。这是明确的信号:大模型的战略地位,已经被提升到了和芯片同一级别。
腾讯拟出资60亿,获得大约2%的股权。但有个细节很有意思:腾讯最初想认购20%的股份,被DeepSeek婉拒了。
阿里巴巴接触过,但谈判破裂了。原因是阿里想获取董事会层面的战略决策权,梁文锋不同意。
你看懂这个格局了吗?
梁文锋拿了大基金的钱,拿了腾讯的钱,但拒绝了阿里的钱。
不是因为阿里出价低。
是因为阿里想要的"生态绑定",不是梁文锋想给的。
他要的是钱,没有附加条件的钱。
02
看到这里,你可能会问:梁文锋为什么突然变卦了?一个坚持了三年不融资的人,为什么在这个时间点破例?
答案藏在三个数字里。
第一个数字:50亿。
这是幻方量化一年的收入。曾经足够支撑DeepSeek的研发,但现在远远不够了。
大模型的训练成本是指数级增长的。V3的训练成本是557万美元,V4已经翻了几倍,到了V4.1、V5,需要的算力会是一个天文数字。幻方量化再能赚钱,也扛不住这种烧法。
第二个数字:5人。
过去一年,至少5个核心研发人员离开了DeepSeek。
这不是普通的离职。郭达雅去了字节Seed,传闻年薪接近一个亿。罗福莉去了小米。王炳宣进了腾讯。V4技术报告的作者列表中,有大约10个人标注了"已离职"。
这些人都是梁文锋一手带出来的。他们是DeepSeek最核心的资产。但字节、小米、腾讯开出的价码,DeepSeek一个不融资的公司根本没法跟。如果你没有期权定价,没有股权激励,你拿什么留住顶尖人才?
第三个数字:34%。
在启动融资之前,梁文锋做了一件事。
他通过工商变更,把自己的直接持股从1%提到了34%。最终受益股份达到84.29%,表决权100%。
这意味着什么?
意味着不管谁来投,不管投多少钱,DeepSeek的控制权始终在梁文锋手里。
他不是因为缺钱才融资。
他是要在不缺钱的时候融资,而且按照他的条件来融。
这才是梁文锋。
03
还有一个更深层的背景,可能比融资本身更值得关注。
DeepSeek V4发布时,做了一个前所未有的决定。
他们没有像行业惯例那样,提前给英伟达和AMD提供早期访问权限。而是选择了另一家芯片公司提前数周进行底层适配优化。
华为昇腾。
V4成了首个从英伟达CUDA框架全面迁移到华为昇腾CANN框架的前沿AI模型。
这不是一次普通的技术适配。路透社的报道用了"打破行业惯例"这个词。黄仁勋在4月的播客访谈中公开警告:"如果DeepSeek先在华为平台上发布,那对我们来说将是灾难性的。"
他说对了。
性能数据已经出来了:昇腾950PR单卡算力是英伟达H20的2.87倍,采购价格只有H200的三分之一到四分之一。经过DeepSeek深度优化后,V4在昇腾芯片上的推理速度比初期版本提升了35倍。
35倍。
这就是为什么大基金要进来。这不是一次财务投资,这是一次生态缝合。用DeepSeek的技术能力,带动整个国产算力产业链的成熟。
从英伟达到华为。
从CUDA到CANN。
从500亿到国产算力的万亿市场。
这才是这500亿真正的故事。
04
把视野拉宽一点。
DeepSeek不是唯一一家在这周爆出融资消息的中国AI公司。
月之暗面(Kimi)刚刚完成了大约20亿美元的新一轮融资,估值突破200亿美元。
阶跃星辰完成了近25亿美元的融资,正在拆除红筹架构冲刺港股IPO。
一周之内,三家公司,累计超过100亿美元。
这不是巧合。
2026年第一季度,中国通用大模型领域的融资总额同比下滑了72%。但资金没有消失,它只是在加速向头部集中。
DeepSeek、月之暗面、阶跃星辰、智谱、MiniMax。
"五虎"格局已经基本确定。接下来就是谁先跑通商业化,谁先实现自我造血,谁能活到下一个阶段。
高盛最近发了一份报告,说企业级智能体将推动全球Token消耗量到2030年增长24倍。市场够大,但窗口期不会太长。
DeepSeek的500亿,买的是12个月的时间窗口。12个月内,V4.1要在6月发布,多模态和MCP协议要落地,企业级产品要跑通。
12个月后,要么证明自己值500亿。
要么证明自己是个泡沫。
05
回到梁文锋这个人。
1985年出生在广东湛江吴川,父亲是小学老师。
2002年以吴川一中高考状元的身份考入浙江大学。
2015年创办幻方量化,做到千亿规模。
2023年创办DeepSeek,三年做到全球最强开源模型。
入选《时代》周刊全球最具影响力100人。
登上《自然》杂志年度十大科学人物。
受邀参加总理座谈会。
然后他做了两件让所有人意外的事。
第一件:V4全面适配华为昇腾,在黄仁勋的眼皮底下完成了"去英伟达化"的第一步。
第二件:从"打死不融资"到狂融500亿,而且自己出200亿。
这两件事看似相反,本质上是一个逻辑。
他做的事情,从来不是为了证明给谁看。而是在他认为对的时间,用他认为对的方式,做他认为对的事。
以前不融资,是因为不需要。现在融资,是因为需要了。
就这么简单。
写在最后
DeepSeek的这500亿,从来不是钱的问题。
它是一个信号,一个标志,一个分水岭。
过去三年,中国AI走的是"技术自信"的路。DeepSeek用557万美元的训练成本做出了比肩GPT-4o的模型,证明了中国人也能做出世界级的AI。
接下来的三年,中国AI要走的是一条"资本自信+产业自信"的路。从单点突破到体系协同,从技术极客到产业生态。这条路需要更多的钱,也需要更多的协作。
梁文锋曾经说过一句话,我印象特别深:
"所有的套路都是上一代的产物,未来不一定成立。"
500亿不是套路。
这是他为未来下的注。
200亿是他自己的钱。
剩下300亿,是中国AI产业对他的信任投票。
至于这个赌注值不值,现在没人知道答案。
但有一件事是确定的:那个曾经拒绝所有人的AI极客,终于下山了。
他带下来的,不只是500亿。
还有一个中国AI公司,第一次用纯本土团队和纯国产算力,站到了全球AI牌桌的中央。
后记
本文基于The Information、金融时报、界面新闻、36氪、钛媒体、21世纪经济报道等多家媒体的公开报道综合整理。
DeepSeek官方尚未正式回应融资详情,最终投资名单和条款以官方公告为准。
📝 本文约2100字,预计朗读9分钟
夜雨聆风