一文看懂当前 AI 工具 “战力榜”-夜雨聆风

一文看懂当前 AI 工具 “战力榜”

最近不少朋友都在问，ChatGPT、Claude、Gemini这些AI模型到底谁更强？不同场景下该怎么选？

今天给大家上一份来自Arena的权威榜单，这份榜单覆盖了文本、代码、视觉、文档处理、文生图、视频生成等几乎所有主流AI应用场景，相当于一份 “全场景AI战力榜”。

为什么选择Arena？这是一个由美国加州大学伯克利分校（UC Berkeley）研究团队打造的、以社区驱动为核心的AI模型评测与交互平台，用 “盲测 + 用户投票” 的方式，对比不同大语言模型的真实表现，参考价值更高。

Arena的排行榜被大量AI研究论文、行业报告引用，是目前最受认可的 “人类偏好驱动” 的AI评测标准之一；任何人都能免费体验和投票，每月有数百万用户参与，数据量远超实验室级别的小样本评测；盲测机制避免了品牌光环效应，能挖掘出很多 “跑分一般但用户体验更好” 的模型。

目前5月2日榜单更新如下，明天将给大家详细捋清楚当前主流 AI工具的真实表现，看完就能按需找到最适合自己的 “AI搭子”：