那个打死不融资的AI公司,刚刚融了500亿

DeepSeek的创始人梁文锋，曾经定过三条铁律。

不接受外部融资。
不稀释股权。
不被任何人的商业化时间表绑架。

这三条规矩，他守了将近三年。

三年里，DeepSeek从一个实验室项目，一路做到全球最强的开源大模型。V2掀起价格战，V3震惊硅谷，R1登上《自然》封面，V4成为首个不依赖英伟达的国产大模型。

三年里，无数投资人踏破门槛。美元基金、国资背景、互联网战投，排着队想给他送钱。

他一律不见。

然后，上周。消息爆出来了。

DeepSeek启动首轮外部融资，目标最高500亿人民币。

梁文锋自己掏了200亿。

01

先看看这500亿是怎么分布的。

消息来自The Information和金融时报，多家中外媒体跟进报道。虽然DeepSeek官方还没有正式回应，但从各方的信息交叉验证来看，轮廓已经相当清晰。

梁文锋个人出资200亿，占40%。这是最让人意外的部分。一个创始人，在公司首轮外部融资中自掏腰包200亿，这在全球科技史上都极为罕见。要知道梁文锋的全部身家也就1846亿左右，这相当于他把个人资产的十分之一以上押了进去。

国家集成电路产业投资基金（大基金）洽谈领投，预计成为第二大股东。注意，这是大基金第一次直接投资大模型公司。在此之前，大基金的投资方向一直是芯片制造和半导体设备。这是明确的信号：大模型的战略地位，已经被提升到了和芯片同一级别。

腾讯拟出资60亿，获得大约2%的股权。但有个细节很有意思：腾讯最初想认购20%的股份，被DeepSeek婉拒了。

阿里巴巴接触过，但谈判破裂了。原因是阿里想获取董事会层面的战略决策权，梁文锋不同意。

你看懂这个格局了吗？

梁文锋拿了大基金的钱，拿了腾讯的钱，但拒绝了阿里的钱。

不是因为阿里出价低。
是因为阿里想要的"生态绑定"，不是梁文锋想给的。

他要的是钱，没有附加条件的钱。

02

看到这里，你可能会问：梁文锋为什么突然变卦了？一个坚持了三年不融资的人，为什么在这个时间点破例？

答案藏在三个数字里。

第一个数字：50亿。

这是幻方量化一年的收入。曾经足够支撑DeepSeek的研发，但现在远远不够了。

大模型的训练成本是指数级增长的。V3的训练成本是557万美元，V4已经翻了几倍，到了V4.1、V5，需要的算力会是一个天文数字。幻方量化再能赚钱，也扛不住这种烧法。

第二个数字：5人。

过去一年，至少5个核心研发人员离开了DeepSeek。

这不是普通的离职。郭达雅去了字节Seed，传闻年薪接近一个亿。罗福莉去了小米。王炳宣进了腾讯。V4技术报告的作者列表中，有大约10个人标注了"已离职"。

这些人都是梁文锋一手带出来的。他们是DeepSeek最核心的资产。但字节、小米、腾讯开出的价码，DeepSeek一个不融资的公司根本没法跟。如果你没有期权定价，没有股权激励，你拿什么留住顶尖人才？

第三个数字：34%。

在启动融资之前，梁文锋做了一件事。

他通过工商变更，把自己的直接持股从1%提到了34%。最终受益股份达到84.29%，表决权100%。

这意味着什么？

意味着不管谁来投，不管投多少钱，DeepSeek的控制权始终在梁文锋手里。

他不是因为缺钱才融资。
他是要在不缺钱的时候融资，而且按照他的条件来融。

这才是梁文锋。

03

还有一个更深层的背景，可能比融资本身更值得关注。

DeepSeek V4发布时，做了一个前所未有的决定。

他们没有像行业惯例那样，提前给英伟达和AMD提供早期访问权限。而是选择了另一家芯片公司提前数周进行底层适配优化。

华为昇腾。

V4成了首个从英伟达CUDA框架全面迁移到华为昇腾CANN框架的前沿AI模型。

这不是一次普通的技术适配。路透社的报道用了"打破行业惯例"这个词。黄仁勋在4月的播客访谈中公开警告："如果DeepSeek先在华为平台上发布，那对我们来说将是灾难性的。"

他说对了。

性能数据已经出来了：昇腾950PR单卡算力是英伟达H20的2.87倍，采购价格只有H200的三分之一到四分之一。经过DeepSeek深度优化后，V4在昇腾芯片上的推理速度比初期版本提升了35倍。

35倍。

这就是为什么大基金要进来。这不是一次财务投资，这是一次生态缝合。用DeepSeek的技术能力，带动整个国产算力产业链的成熟。

从英伟达到华为。
从CUDA到CANN。
从500亿到国产算力的万亿市场。

这才是这500亿真正的故事。

04

把视野拉宽一点。

DeepSeek不是唯一一家在这周爆出融资消息的中国AI公司。

月之暗面（Kimi）刚刚完成了大约20亿美元的新一轮融资，估值突破200亿美元。

阶跃星辰完成了近25亿美元的融资，正在拆除红筹架构冲刺港股IPO。

一周之内，三家公司，累计超过100亿美元。

这不是巧合。

2026年第一季度，中国通用大模型领域的融资总额同比下滑了72%。但资金没有消失，它只是在加速向头部集中。

DeepSeek、月之暗面、阶跃星辰、智谱、MiniMax。

"五虎"格局已经基本确定。接下来就是谁先跑通商业化，谁先实现自我造血，谁能活到下一个阶段。

高盛最近发了一份报告，说企业级智能体将推动全球Token消耗量到2030年增长24倍。市场够大，但窗口期不会太长。

DeepSeek的500亿，买的是12个月的时间窗口。12个月内，V4.1要在6月发布，多模态和MCP协议要落地，企业级产品要跑通。

12个月后，要么证明自己值500亿。
要么证明自己是个泡沫。

05

回到梁文锋这个人。

1985年出生在广东湛江吴川，父亲是小学老师。
2002年以吴川一中高考状元的身份考入浙江大学。
2015年创办幻方量化，做到千亿规模。
2023年创办DeepSeek，三年做到全球最强开源模型。

入选《时代》周刊全球最具影响力100人。
登上《自然》杂志年度十大科学人物。
受邀参加总理座谈会。

然后他做了两件让所有人意外的事。

第一件：V4全面适配华为昇腾，在黄仁勋的眼皮底下完成了"去英伟达化"的第一步。

第二件：从"打死不融资"到狂融500亿，而且自己出200亿。

这两件事看似相反，本质上是一个逻辑。

他做的事情，从来不是为了证明给谁看。而是在他认为对的时间，用他认为对的方式，做他认为对的事。

以前不融资，是因为不需要。现在融资，是因为需要了。

就这么简单。

写在最后

DeepSeek的这500亿，从来不是钱的问题。

它是一个信号，一个标志，一个分水岭。

过去三年，中国AI走的是"技术自信"的路。DeepSeek用557万美元的训练成本做出了比肩GPT-4o的模型，证明了中国人也能做出世界级的AI。

接下来的三年，中国AI要走的是一条"资本自信+产业自信"的路。从单点突破到体系协同，从技术极客到产业生态。这条路需要更多的钱，也需要更多的协作。

梁文锋曾经说过一句话，我印象特别深：

"所有的套路都是上一代的产物，未来不一定成立。"

500亿不是套路。
这是他为未来下的注。

200亿是他自己的钱。
剩下300亿，是中国AI产业对他的信任投票。

至于这个赌注值不值，现在没人知道答案。

但有一件事是确定的：那个曾经拒绝所有人的AI极客，终于下山了。

他带下来的，不只是500亿。
还有一个中国AI公司，第一次用纯本土团队和纯国产算力，站到了全球AI牌桌的中央。

后记

本文基于The Information、金融时报、界面新闻、36氪、钛媒体、21世纪经济报道等多家媒体的公开报道综合整理。

DeepSeek官方尚未正式回应融资详情，最终投资名单和条款以官方公告为准。

📝 本文约2100字，预计朗读9分钟