2026年5月,一条消息在中国科技圈炸开了锅。
DeepSeek要融资了。首轮,500亿人民币。
消息出来那天,我正好在刷科技媒体。翻到这条新闻时,我特意停下来确认了一眼单位。不是美元,是人民币。500亿,换算下来大概73.5亿美元。
这是什么概念?
在DeepSeek之前,中国大模型公司单轮融资的最高纪录是月之暗面(Kimi)刚完成的20亿美元。DeepSeek这一把,直接是把之前的纪录翻了三倍。
更夸张的是估值。500亿融资额到位后,DeepSeek整体估值将突破3500亿人民币,约515亿美元。这个数字,比Kimi的200亿估值高了整整两倍半,也超过了MiniMax的300亿、智谱AI的500亿市值。
中国AI新一哥,正式出锅。
但如果你仔细想想这件事,会觉得哪里有点不对。
DeepSeek不是号称「不差钱」吗?
它背后的幻方量化,2025年平均收益率56.6%,管理规模超过700亿。按1%管理费加20%业绩提成粗算,光一年就进账50亿人民币。
创始人梁文锋之前也公开说过:「VC的钱是负担,VC都是帮LP管钱的,都得赚钱,谈不到一块去。」
那为什么现在突然要融这么多钱?
答案很简单:不是DeepSeek缺钱,是中国AI竞争的玩法变了。
牌桌上的玩家,早就不是那批人
2023年7月,DeepSeek成立。
那时候的大模型赛道,国内玩家还没这么多。百度有文心一言,阿里有通义千问,字节有豆包,月之暗面刚起步,MiniMax还在打磨产品。
DeepSeek的玩法很特别。
它不做独立App,不做付费订阅,甚至不急于商业化。而是闷头搞技术,一年只发几个模型,发布即开源。
V2版本出来时,API定价只有行业平均水平的十分之一。V3和V4更是把价格一路杀到地板价。V4-Pro每百万token输入只要12元,V4-Flash更是低至1元。
行业的人都知道,这是在用幻方的钱换市场,用技术优势换开发者生态。
效果也确实达到了。MIT与Hugging Face的联合研究显示,截至2025年8月,中国开源模型在全球下载总量中已占17.1%,首次超越美国的15.86%。这其中,DeepSeek和阿里Qwen是最大的两个贡献者。
开发者社区里,DeepSeek的口碑肉眼可见地起来了。GitHub上各种基于DeepSeek的开源项目星量猛增,Redis创始人Antirez专门为它写了本地推理引擎。
技术实力,没人会质疑。
但问题也来了:技术强,不代表商业强。
低价的代价
DeepSeek的定价策略,一直是行业里最大的争议点。
支持者说,这是普惠AI,让中小企业也能用上顶级模型。批评者说,这是自杀式定价,根本不赚钱。
DeepSeek自己公开过一组数据。2025年3月开源周,他们公布了推理成本:V3和R1推理服务平均占用226.75个节点,每个节点8张H800 GPU。按当时的价格算,单次调用根本不亏钱,还有利润。前员工也透露,V2版本API利润率超过50%。
「不贴钱,也不赚取暴利。」这是原话。
但这个利润率,是建立在「单次调用」的基础上的。行业真正担心的,是另一笔账:
V4-Pro定价12元/百万token,官方说下半年还要继续降价。要支撑515亿美元的估值,按100倍P/S算,需要年收入5亿美元,约35亿人民币。
12元的单价,要多少调用量才能凑够35亿?
更致命的是,DeepSeek全程开源。
模型开源意味着什么?企业用户可以直接下载部署,不再需要付费调用API。
我看到21经济采访过一家金融投研平台的创始人,对方说:模型没开源之前,他们一直按调用量付费使用API服务;模型开源之后,他们直接自主部署,不再向DeepSeek付费了。
开源帮DeepSeek拿下了开发者的口碑,搭建了成熟的生态。但代价也很明显:大量原本愿意付费的客户,变成了免费自用用户。
低价压缩了一次利润,开源又分流了付费用户。两头一堵,收入的天花板肉眼可见。
反观竞争对手Kimi,4月刚把ARR做到2亿美元。独立App、付费订阅、Claude Code类产品,营收路径清晰得多。
技术第一,收入垫底。这个落差,资本市场不可能一直无视。
国家资本进场
于是,故事来到了2026年5月。
根据《金融时报》和多家媒体报道,国家集成电路产业投资基金——也就是外界常说的「国家大基金」——正在洽谈领投DeepSeek首轮融资,潜在估值约450亿美元。
与此同时,阿里、腾讯等互联网巨头也在谈判桌上。
这是一个非常明显的信号:大模型竞争,已经从「公司级」上升到了「国家战略级」。
过去几年,大基金主要投的是半导体产业链:设备、材料、芯片、制造。但现在,它要投大模型了。
为什么?
因为大模型竞争的底层,是算力、是芯片、是国家数字基础设施。
美国对高端GPU的限制越来越紧,中国必须有自己的替代方案。DeepSeek-V4已经实现了与华为昇腾芯片的全链路国产化适配,训练框架从英伟达CUDA切到了华为CANN。
这就不是在做一个创业公司了,而是在验证一条「国产AI替代」的完整技术路线。
从这个角度再看500亿的融资,就很好理解了。
它买的不是DeepSeek这家公司,而是中国AI在全球竞争版图上的一张门票。
梁文锋的「最后一战」
还有一个细节值得关注。
2026年4月27日,也就是融资消息曝光前几天,DeepSeek主体公司注册资本从1000万增至15000万,创始人梁文锋直接持股比例从1%升至34%。算上间接持股,他合计控制约84.29%的股份。
融资前先加固控制权。钱可以进来,但方向盘不能交出去。
这很符合梁文锋一贯的风格。
外界给他贴过很多标签:量化大佬、技术天才、理想主义者。但他自己最常提的一个身份是「Visionary」——有远见的人。
2019年,幻方量化内部就讨论过大模型的方向。梁文锋当时判断,AI一定会在未来几年出现质的突破,而中国不能缺席。
2023年,他拿出真金白银下场,DeepSeek正式成立。
2025年,幻方收益率56.6%,管理规模超700亿。光是这一年,梁文锋个人能支配的资金就超过7亿美元。
按理说,靠幻方输血,DeepSeek继续「小而精」地运营,完全没问题。
但梁文锋显然不满足于「活着就好」。
行业正在快速从Chatbot时代切换到Agent时代。复杂任务链消耗的token是过去的几十倍甚至上百倍。推理成本指数级上涨,研发投入几何级增长。
而且,核心人才正在流失。
公开信息显示,DeepSeek V2/V3关键贡献者罗福莉被雷军千万年薪挖走,R1核心研究员郭达雅加入字节跳动Seed团队,OCR核心作者魏浩然、多模态项目负责人阮翀也先后离职。
顶级人才就这么多,竞争对手都在抢。DeepSeek如果要保持在第一梯队,必须加码。
500亿融资,就是梁文锋的「军备竞赛」入场券。
牌桌上的代价
故事讲到这,再回头看标题那个「才」字,就很有意思了。
「DeepSeek上桌费才500亿?」
这个「才」字,透着一股子轻描淡写。但如果你了解中国AI竞争的现状,就不会这么想了。
Anisotropic、MiniMax、月之暗面、智谱、百度、阿里、字节……每个玩家都在烧钱。模型参数越堆越大,推理成本越来越高,人才薪资越来越离谱。
这已经不是靠技术理想就能撑下去的时代了。
国家大基金入场,说明一件事:中国AI的竞争,已经从「商业公司之间的比赛」变成了「国家数字基础设施的竞争」。
500亿很多,但这是现在的「最低消费」。
上一个十年,中国互联网公司烧钱换市场,培养了用户习惯,建立了平台经济。这一次,押注的是更贵的东西:算力自主、模型自主、AI生态自主。
DeepSeek不是第一个上桌的,也不会是最后一个。
但有一点是确定的:坐上这张牌桌,就没那么容易下去了。
梁文锋刚强化完控制权,融完资下一阶段就是产品化落地。V4.1据报6月推出,会增加企业工具和MCP协议支持。
能不能在接下来12个月里做出可匹配估值的产品,才是这500亿真正要回答的问题。
没人能给出笃定的答案。
但牌已经上了,就得把牌打完。
参考资料:金融时报、The Information、21世纪经济报道、虎嗅网、知乎专栏、华福证券研报、公开信息整理
夜雨聆风