
在开始今天的内容之前,先问各位一个问题:你觉得最前沿的AI技术,最后会走向精英化,还是变成人人都用得起的标配?如果你正在思考,不妨点个关注,我们一起来捋一捋。
这段时间,好几个朋友后台私信我,让我聊聊DeepSeek这波操作。说实话,我自己也琢磨了好几天。今天这篇文章我写得特别认真,信息量也大,如果你觉得有帮助,希望能转发给身边关注科技的朋友,也别忘了在评论区聊聊你的看法。
好,我们开始。
这几天我一直在想一个问题:DeepSeek到底在下一盘什么棋?

4月24号,DeepSeek-V4上线,性能评测全网刷屏。5月6号,国家大基金领投首轮融资的消息炸开了锅,投后估值450亿美元,折合人民币将近3100亿,据说还有腾讯、阿里等多家机构在低调竞逐入局资格。
从去年春节横空出世至今不到一年半,DeepSeek这个月干了三件大事——发新模型、降价、融资。三件事单看没什么,串在一起,估值就飙到了国内大模型赛道第一梯队的头部。
但这不是我今天想聊的重点。估值再高、融资再大,都是圈内人关心的事。我想聊的,是这个月发生的另一件事——一件让AI圈所有人震撼的事。
一、一个让硅谷沉默的数字组合
时间线拉回到4月下旬。
4月23日,OpenAI发布了GPT-5.5,标准报价:输入每百万Token 5美元,输出每百万Token 30美元。比上一代直接翻了一倍。
第二天,4月24日,DeepSeek-V4上线。同样1M超长上下文、同样顶级的Coding和推理能力,V4-Pro的输入价格是1元/百万Token,输出24元。然后,4月25日,限时2.5折。4月26日,全系API输入缓存命中价格降到首发价的十分之一。
连降两天之后,V4-Pro缓存命中输入价格变成了——0.025元/百万Token。
0.025元。这不是写错了。DeepSeek把大模型API的价格彻底击穿了。
用两边的数字具体对比一下,就看得更清楚了。缓存命中的情况下,DeepSeek V4-Pro的输入成本折合0.0035美元,而GPT-5.5是0.50美元。输出成本更悬殊——DeepSeek这边折合0.83美元,GPT-5.5要30美元。折算到一次标准Agent任务的完整调用,DeepSeek这边大概1美元,GPT-5.5是35美元上下。
同样的任务,一边是一美元,一边是三十多美元。成本差了30倍。
我看完这个对比,脑子里只有一个想法:OpenAI和DeepSeek,在同一天给出了两个截然相反的方向。
这已经不能用"价格竞争"来解释了。这是一场彻底的估值体系撕裂。全世界第一次亲眼目睹:东西方两个AI顶尖玩家,站在同一个坐标点上,走上了完全相反的路。
而DeepSeek在做一件看似违背商业逻辑的事:性能可以对标GPT-5.5,价格却只有对手几分之一。
这是为什么?
二、"我不跟你比最强,我只要人人都能用"
想理解这件事,先看V4是什么。
多数大模型发布的时候都会告诉你"我是最强的"。但DeepSeek-V4在技术报告里写了一句"反行业"的话——他们主动承认V4的能力仍落后GPT-5.4或Gemini-3.1-Pro三到六个月不等。
就是这句话,被全网戏称为"主动认输"。但如果你仔细看V4做了什么,就知道这根本不是"认输"。
V4做了三件事:
第一,1.6万亿参数、百万token的超长上下文能力,全版本标配,不加价。放在以前,你只能单独掏钱开更高的订阅级别。

第二,通过自研的压缩稀疏注意力机制,长文本推理算力消耗直接压到前代模型的27%,显存只占原来的10%。这台机器用同等算力,可以供10倍的开发者和用户,这是从底层架构掀了桌子的优化。
第三,兼容OpenAI和Anthropic双API接口格式,开发者从GPT迁移到V4,改一行参数就行,迁移成本几乎是零。
看懂了吗?DeepSeek不是追最强,而是做最普适。别人在做"奢侈品",它要做"水电煤"。当你把模型做到便宜到几乎不成为成本的时候,使用门槛就归零了。
而这一切的前提,是开源。V4模型权重直接被上传到了Hugging Face——任何人都可以免费下载、部署、商用。
开源、低压、宽路线、低成本,这四个维度加在一起,就是AI的工业化。
三、便宜不是手段,便宜是目的——DeepSeek戳破了偏见
这也让我想起了这个月另一个很有意思的现象。
DeepSeek-V4上线不久,"DeepSeek审美在线"和"DeepSeek审丑"这两个词条一度冲上热搜。为什么?因为有人发现无论让它生成图片还是分析视觉作品,都渗透着一种古怪的审美,甚至被认为"丑"。
但仔细看下来,你会发现这根本不是模型审美出了问题,而是DeepSeek坚持了另一条设计原则:不被西方数据集定义审美。
这也是国内AI长期以来最大的隐痛。想要性能强,数据集得用海外的;想用国产算力,芯片生态又不支持;想做到全球最低价,但基建成本根本没法摊薄。你只能用别人的工具,然后永远在"像他一样好"的框架里打转。
但DeepSeek在它发布的V4技术报告里透露了一个极其关键的细节:这一代模型在两个计算平台上做了同步验证——一个是英伟达,一个是华为昇腾。虽然目前高端昇腾还没量产,但报告里明确说"下半年支持华为算力"。
这一点才是真正杀伤力的来源,也或许是国资下场的最终原因。
四、从杭州到芝加哥:一个全新的"范式"
我在关注ASCO的间隙抽空看了一下DeepSeek的数据,突然意识到这两件事是有共同之处的——它们都在改变"中国公司怎么出海"这个古老问题的答案。
不管是ASCO上的中国创新药,还是V4同步跑在美国Hugging Face和华为昇腾上的二进制代码,它们的路径完全一样:不靠政策红利,不靠低价倾销实物,而是靠知识产权的完整输出——在同一个规则下打比赛,用对方必须正视的数据和代码说话。
最明显的铁证是:V4发布首日突破170万注册用户,登顶应用商店排行榜。降价首日V4-Pro的调用量一天内就飙升了将近4倍。
便宜=更广泛、更快速的普及。

当一个大模型可以做到一次调用成本低于一分钱,就打破了从企业到个体户再到学生党的所有成本障碍。它能下沉到最普通的社区医院助诊、下沉到乡镇学校的因材施教,下沉到小作坊的生产排期,让那些根本无力承担传统企业级AI定价的普通人,第一次摸得到智能的门槛。
它不再是未来科技,它是水电煤。
最后,说一个让我个人恍然大悟的细节。DeepSeek说下半年将在昇腾超节点芯片量产之后再次大幅降价。在他们的商业模型里,算力越便宜,价格越低;价格越低,使用者越多;使用者越多,模型跑得数据越厚,下一代模型就会更强。
这盘棋——不是价格的游戏,而是规模的赌局。DeepSeek赌的是:越便宜,越普及;越普及,越不可替代。
以上都是我个人复盘的一些想法,不构成任何投资建议。咱们评论区聊。
夜雨聆风