DeepSeek上桌费才500亿?中国AI的牌桌,早就不便宜了

2026年5月，一条消息在中国科技圈炸开了锅。

DeepSeek要融资了。首轮，500亿人民币。

消息出来那天，我正好在刷科技媒体。翻到这条新闻时，我特意停下来确认了一眼单位。不是美元，是人民币。500亿，换算下来大概73.5亿美元。

这是什么概念？

在DeepSeek之前，中国大模型公司单轮融资的最高纪录是月之暗面（Kimi）刚完成的20亿美元。DeepSeek这一把，直接是把之前的纪录翻了三倍。

更夸张的是估值。500亿融资额到位后，DeepSeek整体估值将突破3500亿人民币，约515亿美元。这个数字，比Kimi的200亿估值高了整整两倍半，也超过了MiniMax的300亿、智谱AI的500亿市值。

中国AI新一哥，正式出锅。

但如果你仔细想想这件事，会觉得哪里有点不对。

DeepSeek不是号称「不差钱」吗？

它背后的幻方量化，2025年平均收益率56.6%，管理规模超过700亿。按1%管理费加20%业绩提成粗算，光一年就进账50亿人民币。

创始人梁文锋之前也公开说过：「VC的钱是负担，VC都是帮LP管钱的，都得赚钱，谈不到一块去。」

那为什么现在突然要融这么多钱？

答案很简单：不是DeepSeek缺钱，是中国AI竞争的玩法变了。

牌桌上的玩家，早就不是那批人

2023年7月，DeepSeek成立。

那时候的大模型赛道，国内玩家还没这么多。百度有文心一言，阿里有通义千问，字节有豆包，月之暗面刚起步，MiniMax还在打磨产品。

DeepSeek的玩法很特别。

它不做独立App，不做付费订阅，甚至不急于商业化。而是闷头搞技术，一年只发几个模型，发布即开源。

V2版本出来时，API定价只有行业平均水平的十分之一。V3和V4更是把价格一路杀到地板价。V4-Pro每百万token输入只要12元，V4-Flash更是低至1元。

行业的人都知道，这是在用幻方的钱换市场，用技术优势换开发者生态。

效果也确实达到了。MIT与Hugging Face的联合研究显示，截至2025年8月，中国开源模型在全球下载总量中已占17.1%，首次超越美国的15.86%。这其中，DeepSeek和阿里Qwen是最大的两个贡献者。

开发者社区里，DeepSeek的口碑肉眼可见地起来了。GitHub上各种基于DeepSeek的开源项目星量猛增，Redis创始人Antirez专门为它写了本地推理引擎。

技术实力，没人会质疑。

但问题也来了：技术强，不代表商业强。

低价的代价

DeepSeek的定价策略，一直是行业里最大的争议点。

支持者说，这是普惠AI，让中小企业也能用上顶级模型。批评者说，这是自杀式定价，根本不赚钱。

DeepSeek自己公开过一组数据。2025年3月开源周，他们公布了推理成本：V3和R1推理服务平均占用226.75个节点，每个节点8张H800 GPU。按当时的价格算，单次调用根本不亏钱，还有利润。前员工也透露，V2版本API利润率超过50%。

「不贴钱，也不赚取暴利。」这是原话。

但这个利润率，是建立在「单次调用」的基础上的。行业真正担心的，是另一笔账：

V4-Pro定价12元/百万token，官方说下半年还要继续降价。要支撑515亿美元的估值，按100倍P/S算，需要年收入5亿美元，约35亿人民币。

12元的单价，要多少调用量才能凑够35亿？

更致命的是，DeepSeek全程开源。

模型开源意味着什么？企业用户可以直接下载部署，不再需要付费调用API。

我看到21经济采访过一家金融投研平台的创始人，对方说：模型没开源之前，他们一直按调用量付费使用API服务；模型开源之后，他们直接自主部署，不再向DeepSeek付费了。

开源帮DeepSeek拿下了开发者的口碑，搭建了成熟的生态。但代价也很明显：大量原本愿意付费的客户，变成了免费自用用户。

低价压缩了一次利润，开源又分流了付费用户。两头一堵，收入的天花板肉眼可见。

反观竞争对手Kimi，4月刚把ARR做到2亿美元。独立App、付费订阅、Claude Code类产品，营收路径清晰得多。

技术第一，收入垫底。这个落差，资本市场不可能一直无视。

国家资本进场

于是，故事来到了2026年5月。

根据《金融时报》和多家媒体报道，国家集成电路产业投资基金——也就是外界常说的「国家大基金」——正在洽谈领投DeepSeek首轮融资，潜在估值约450亿美元。

与此同时，阿里、腾讯等互联网巨头也在谈判桌上。

这是一个非常明显的信号：大模型竞争，已经从「公司级」上升到了「国家战略级」。

过去几年，大基金主要投的是半导体产业链：设备、材料、芯片、制造。但现在，它要投大模型了。

为什么？

因为大模型竞争的底层，是算力、是芯片、是国家数字基础设施。

美国对高端GPU的限制越来越紧，中国必须有自己的替代方案。DeepSeek-V4已经实现了与华为昇腾芯片的全链路国产化适配，训练框架从英伟达CUDA切到了华为CANN。

这就不是在做一个创业公司了，而是在验证一条「国产AI替代」的完整技术路线。

从这个角度再看500亿的融资，就很好理解了。

它买的不是DeepSeek这家公司，而是中国AI在全球竞争版图上的一张门票。

梁文锋的「最后一战」

还有一个细节值得关注。

2026年4月27日，也就是融资消息曝光前几天，DeepSeek主体公司注册资本从1000万增至15000万，创始人梁文锋直接持股比例从1%升至34%。算上间接持股，他合计控制约84.29%的股份。

融资前先加固控制权。钱可以进来，但方向盘不能交出去。

这很符合梁文锋一贯的风格。

外界给他贴过很多标签：量化大佬、技术天才、理想主义者。但他自己最常提的一个身份是「Visionary」——有远见的人。

2019年，幻方量化内部就讨论过大模型的方向。梁文锋当时判断，AI一定会在未来几年出现质的突破，而中国不能缺席。

2023年，他拿出真金白银下场，DeepSeek正式成立。

2025年，幻方收益率56.6%，管理规模超700亿。光是这一年，梁文锋个人能支配的资金就超过7亿美元。

按理说，靠幻方输血，DeepSeek继续「小而精」地运营，完全没问题。

但梁文锋显然不满足于「活着就好」。

行业正在快速从Chatbot时代切换到Agent时代。复杂任务链消耗的token是过去的几十倍甚至上百倍。推理成本指数级上涨，研发投入几何级增长。

而且，核心人才正在流失。

公开信息显示，DeepSeek V2/V3关键贡献者罗福莉被雷军千万年薪挖走，R1核心研究员郭达雅加入字节跳动Seed团队，OCR核心作者魏浩然、多模态项目负责人阮翀也先后离职。

顶级人才就这么多，竞争对手都在抢。DeepSeek如果要保持在第一梯队，必须加码。

500亿融资，就是梁文锋的「军备竞赛」入场券。

牌桌上的代价

故事讲到这，再回头看标题那个「才」字，就很有意思了。

「DeepSeek上桌费才500亿？」

这个「才」字，透着一股子轻描淡写。但如果你了解中国AI竞争的现状，就不会这么想了。

Anisotropic、MiniMax、月之暗面、智谱、百度、阿里、字节……每个玩家都在烧钱。模型参数越堆越大，推理成本越来越高，人才薪资越来越离谱。

这已经不是靠技术理想就能撑下去的时代了。

国家大基金入场，说明一件事：中国AI的竞争，已经从「商业公司之间的比赛」变成了「国家数字基础设施的竞争」。

500亿很多，但这是现在的「最低消费」。

上一个十年，中国互联网公司烧钱换市场，培养了用户习惯，建立了平台经济。这一次，押注的是更贵的东西：算力自主、模型自主、AI生态自主。

DeepSeek不是第一个上桌的，也不会是最后一个。

但有一点是确定的：坐上这张牌桌，就没那么容易下去了。

梁文锋刚强化完控制权，融完资下一阶段就是产品化落地。V4.1据报6月推出，会增加企业工具和MCP协议支持。

能不能在接下来12个月里做出可匹配估值的产品，才是这500亿真正要回答的问题。

没人能给出笃定的答案。

但牌已经上了，就得把牌打完。

参考资料：金融时报、The Information、21世纪经济报道、虎嗅网、知乎专栏、华福证券研报、公开信息整理