中国AI最大的“审丑”事件 deepseek V4.0

在开始今天的内容之前，先问各位一个问题：你觉得最前沿的AI技术，最后会走向精英化，还是变成人人都用得起的标配？如果你正在思考，不妨点个关注，我们一起来捋一捋。

这段时间，好几个朋友后台私信我，让我聊聊DeepSeek这波操作。说实话，我自己也琢磨了好几天。今天这篇文章我写得特别认真，信息量也大，如果你觉得有帮助，希望能转发给身边关注科技的朋友，也别忘了在评论区聊聊你的看法。

好，我们开始。

这几天我一直在想一个问题：DeepSeek到底在下一盘什么棋？

4月24号，DeepSeek-V4上线，性能评测全网刷屏。5月6号，国家大基金领投首轮融资的消息炸开了锅，投后估值450亿美元，折合人民币将近3100亿，据说还有腾讯、阿里等多家机构在低调竞逐入局资格。

从去年春节横空出世至今不到一年半，DeepSeek这个月干了三件大事——发新模型、降价、融资。三件事单看没什么，串在一起，估值就飙到了国内大模型赛道第一梯队的头部。

但这不是我今天想聊的重点。估值再高、融资再大，都是圈内人关心的事。我想聊的，是这个月发生的另一件事——一件让AI圈所有人震撼的事。

一、一个让硅谷沉默的数字组合

时间线拉回到4月下旬。

4月23日，OpenAI发布了GPT-5.5，标准报价：输入每百万Token 5美元，输出每百万Token 30美元。比上一代直接翻了一倍。

第二天，4月24日，DeepSeek-V4上线。同样1M超长上下文、同样顶级的Coding和推理能力，V4-Pro的输入价格是1元/百万Token，输出24元。然后，4月25日，限时2.5折。4月26日，全系API输入缓存命中价格降到首发价的十分之一。

连降两天之后，V4-Pro缓存命中输入价格变成了——0.025元/百万Token。

0.025元。这不是写错了。DeepSeek把大模型API的价格彻底击穿了。

用两边的数字具体对比一下，就看得更清楚了。缓存命中的情况下，DeepSeek V4-Pro的输入成本折合0.0035美元，而GPT-5.5是0.50美元。输出成本更悬殊——DeepSeek这边折合0.83美元，GPT-5.5要30美元。折算到一次标准Agent任务的完整调用，DeepSeek这边大概1美元，GPT-5.5是35美元上下。

同样的任务，一边是一美元，一边是三十多美元。成本差了30倍。

我看完这个对比，脑子里只有一个想法：OpenAI和DeepSeek，在同一天给出了两个截然相反的方向。

这已经不能用"价格竞争"来解释了。这是一场彻底的估值体系撕裂。全世界第一次亲眼目睹：东西方两个AI顶尖玩家，站在同一个坐标点上，走上了完全相反的路。

而DeepSeek在做一件看似违背商业逻辑的事：性能可以对标GPT-5.5，价格却只有对手几分之一。

这是为什么？

二、"我不跟你比最强，我只要人人都能用"

想理解这件事，先看V4是什么。

多数大模型发布的时候都会告诉你"我是最强的"。但DeepSeek-V4在技术报告里写了一句"反行业"的话——他们主动承认V4的能力仍落后GPT-5.4或Gemini-3.1-Pro三到六个月不等。

就是这句话，被全网戏称为"主动认输"。但如果你仔细看V4做了什么，就知道这根本不是"认输"。

V4做了三件事：

第一，1.6万亿参数、百万token的超长上下文能力，全版本标配，不加价。放在以前，你只能单独掏钱开更高的订阅级别。

第二，通过自研的压缩稀疏注意力机制，长文本推理算力消耗直接压到前代模型的27%，显存只占原来的10%。这台机器用同等算力，可以供10倍的开发者和用户，这是从底层架构掀了桌子的优化。

第三，兼容OpenAI和Anthropic双API接口格式，开发者从GPT迁移到V4，改一行参数就行，迁移成本几乎是零。

看懂了吗？DeepSeek不是追最强，而是做最普适。别人在做"奢侈品"，它要做"水电煤"。当你把模型做到便宜到几乎不成为成本的时候，使用门槛就归零了。

而这一切的前提，是开源。V4模型权重直接被上传到了Hugging Face——任何人都可以免费下载、部署、商用。

开源、低压、宽路线、低成本，这四个维度加在一起，就是AI的工业化。

三、便宜不是手段，便宜是目的——DeepSeek戳破了偏见

这也让我想起了这个月另一个很有意思的现象。

DeepSeek-V4上线不久，"DeepSeek审美在线"和"DeepSeek审丑"这两个词条一度冲上热搜。为什么？因为有人发现无论让它生成图片还是分析视觉作品，都渗透着一种古怪的审美，甚至被认为"丑"。

但仔细看下来，你会发现这根本不是模型审美出了问题，而是DeepSeek坚持了另一条设计原则：不被西方数据集定义审美。

这也是国内AI长期以来最大的隐痛。想要性能强，数据集得用海外的；想用国产算力，芯片生态又不支持；想做到全球最低价，但基建成本根本没法摊薄。你只能用别人的工具，然后永远在"像他一样好"的框架里打转。

但DeepSeek在它发布的V4技术报告里透露了一个极其关键的细节：这一代模型在两个计算平台上做了同步验证——一个是英伟达，一个是华为昇腾。虽然目前高端昇腾还没量产，但报告里明确说"下半年支持华为算力"。

这一点才是真正杀伤力的来源，也或许是国资下场的最终原因。

四、从杭州到芝加哥：一个全新的"范式"

我在关注ASCO的间隙抽空看了一下DeepSeek的数据，突然意识到这两件事是有共同之处的——它们都在改变"中国公司怎么出海"这个古老问题的答案。

不管是ASCO上的中国创新药，还是V4同步跑在美国Hugging Face和华为昇腾上的二进制代码，它们的路径完全一样：不靠政策红利，不靠低价倾销实物，而是靠知识产权的完整输出——在同一个规则下打比赛，用对方必须正视的数据和代码说话。

最明显的铁证是：V4发布首日突破170万注册用户，登顶应用商店排行榜。降价首日V4-Pro的调用量一天内就飙升了将近4倍。

便宜=更广泛、更快速的普及。

当一个大模型可以做到一次调用成本低于一分钱，就打破了从企业到个体户再到学生党的所有成本障碍。它能下沉到最普通的社区医院助诊、下沉到乡镇学校的因材施教，下沉到小作坊的生产排期，让那些根本无力承担传统企业级AI定价的普通人，第一次摸得到智能的门槛。

它不再是未来科技，它是水电煤。

最后，说一个让我个人恍然大悟的细节。DeepSeek说下半年将在昇腾超节点芯片量产之后再次大幅降价。在他们的商业模型里，算力越便宜，价格越低；价格越低，使用者越多；使用者越多，模型跑得数据越厚，下一代模型就会更强。

这盘棋——不是价格的游戏，而是规模的赌局。DeepSeek赌的是：越便宜，越普及；越普及，越不可替代。

以上都是我个人复盘的一些想法，不构成任何投资建议。咱们评论区聊。