AI | DeepSeek新模型遇冷:价格打到对手1/10,却难再复制轰动效应
声明:本公众号以分享市场信息,探讨经济相关知识为原则,仅与广大投资者分享交流,不构成投资建议。资本市场有风险,投资需谨慎。
本文来源于经济学人2026年5月2日刊,53-54页,原文标题Artificial intelligence (2)- Sequel struggles(人工智能(2)——续集困境),文中观点仅代表《经济学人》一家之言,读者们可舍短取长。正文可能有删改,使用AI工具翻译及配图配文
导读:DeepSeek新模型v4遇冷,核心原因在于其发布已不再具备当初那种颠覆性成本优势的轰动效应。尽管性能依然强劲且使用价格低廉,但构建成本不再显著低于西方同行,且长达16个月的研发周期暗示其同样耗费了巨量算力。在中国,人工智能竞争焦点已从单纯发布聪明模型转向构建能赚钱的应用与生态,DeepSeek面临阿里巴巴、字节跳动等巨头在应用层的激烈挤压。
为何DeepSeek新模型遇冷
一年多前,一家中国小型人工智能初创公司震惊了世界。当DeepSeek推出两款性能几乎媲美西方顶尖模型、但构建成本仅为其零头的模型时,恐慌迅速蔓延。英伟达及其他人工智能基础设施提供商的股价一度暴跌,投资者担心(事实证明是错误地)面对模型构建效率如此飞跃,对其产品的需求将放缓。然而,该实验室4月24日发布的新模型v4却遭遇了冷遇。原因何在?
DeepSeek的最新发布在其前作曾达到的诸多高度上再度登顶。根据该公司进行的测试,其最强大的”Pro”系统性能仅略逊于领先的美国竞争对手三到六个月前推出的模型。DeepSeek的v4对客户而言同样廉价。一项限时优惠将其部分用途的价格定为美国最佳模型的千分之一。即便在该费率于5月7日到期后,v4的价格也仅相当于美国同类产品的十分之一到四分之一。
但似乎与DeepSeek上次轰动一时的发布不同,v4的构建成本并非特别低廉。2025年,该实验室曾急切指出其人工智能训练成本约为600万美元,远低于西方现行的费用水平。然而,该实验室关于v4的技术白皮书却略去了对此项指标的任何估算。v4与其前代产品间隔了16个月之久,这一事实也暗示训练它动用了巨量算力。
此次发布正值中国人工智能领域日益拥挤之际。DeepSeek面临着来自其他独立实验室(如Moonshot月之暗面和Z.ai智谱)以及本国互联网巨头日益激烈的竞争。电商巨擘阿里巴巴出品的Qwen系列模型,在过去一年的大部分时间里稳稳占据中国排行榜首。TikTok的缔造者字节跳动也是中国最受欢迎的聊天机器人豆包的制造商。豆包在海外名为Dola,在墨西哥、菲律宾和英国极受欢迎,在苹果应用商店中的排名高于谷歌的Gemini。
在中国,大部分注意力已转向构建在人工智能之上的应用程序。例如,阿里巴巴将Qwen模型应用于其业务的其他领域,为使用其电商平台的商家提供”数字化劳动力”。中国互联网巨头目前正竞相打造能够支持广泛数字交易的人工智能”超级应用”。仅有聪明的模型本身,并不被视为利用该技术赚钱的途径。
与此同时,DeepSeek还不得不应对国内日益加剧的*。*一直在扶持国内半导体领军企业华为制造的芯片。据报道,DeepSeek曾试图在这些芯片上训练其新模型,但最终仍退回到使用英伟达的芯片,增加了成本和时间。*似乎不太可能在短期内给予本土人工智能公司更自由的空间:4月27日,它表示将阻止美国社交媒体巨头Meta对另一家中国人工智能宠儿Manus的收购。这家初创公司的联合创始人*。
DeepSeek最新发布的遇冷,并不值得惋惜。美国实验室Anthropic最近判定其前沿的Mythos模型因具备黑客能力而威力过于强大,不宜广泛发布。相比之下,DeepSeek v4所附带的文件则完全未提及安全保障措施。如果中国实验室真的追上了其美国同行,它们或许不会表现出同样的克制。
夜雨聆风