5月8日,TalkingData与WeToken联合发布了4月AI大模型风向榜,这份榜单对国内AI大模型进行了全面评测,为行业提供了极具参考价值的指标体系。
核心大模型榜单
在核心大模型赛道,本月新发布的DeepSeek V4以98.1的竞争力指数强势夺冠,在综合通用能力上与其他模型拉开了明显差距。紧随其后的是阿里巴巴的Qwen3.6-Plus与智谱的GLM-5.1,这三款国产大模型占据了榜单前三的位置,彰显了国产大模型在全球竞争中的强劲实力。
值得关注的是,榜单呈现出明显的"新旧并存"格局。DeepSeek V4、Qwen3.6-Plus、Kimi K2.6等新版本模型空降前五的同时,旧版本模型也同时上榜。这表明当前的大模型比拼已不再是"单打独斗",而是各大厂商的"模型矩阵"在同时发力,体现了头部企业深厚的技术积累与持续迭代能力。

创意生成类模型
在创意生成领域,字节跳动的Seedance 2.0与快手的Kling Video 3.0分列前两名,展现了视频生成赛道的激烈竞争态势。阿里巴巴发布的HappyHorse-1.0模型则以黑马姿态位列第四,这款150亿参数的多模态视频大模型自发布以来便受到广泛关注,其原生支持音视频联合生成的能力成为竞争亮点。

从榜单排名标准可以看出,当前大模型评测更注重实际应用表现,参数内卷已不再是主流,能用、好用、实用成为核心标准。视频模型虽然整体表现领先,但垂直领域模型如腾讯混元HunyuanImage、百度文心一言ERNIE-Writing仍具竞争力,说明小而美的场景化工具仍有广阔需求空间。
4月AI大模型风向榜不仅是一份排名,更是对中国AI产业整体发展水平的一次集中检阅。国产大模型在通用能力、代码编程、创意生成等多个维度均已达到国际一流水平,未来能用、好用、实用将成为产品竞争的关键分水岭。
夜雨聆风