2026年4月,AI视频赛道迎来一场猝不及防的“地震”。4月7日深夜,国际AI评测平台Artificial Analysis在X平台悄然发布一则简短公告,宣布其Video Arena榜单新增一款匿名视频模型,代号HappyHorse-1.0。没有铺天盖地的发布会,没有详尽的技术博客解读,甚至没有任何机构署名背书,这款“零宣传”的模型,用48小时的时间,完成了一场惊艳业界的逆袭。
短短两天内,HappyHorse-1.0的Elo评分一路飙升,文本转视频赛道从初始的1347分攀升至1378分,图像转视频赛道从1391分突破至1411分,两大核心赛道双双登顶,将此前稳坐榜首的字节跳动Seedance 2.0远远甩在身后。更令人震惊的是,它与第二名Seedance 2.0的分差达到60至74分,而榜单上第二名到第十九名的累计分差,也不过70分出头——这意味着,HappyHorse-1.0的领先优势,相当于碾压了后续近二十款主流模型的差距总和,其爆发力堪称AI视频领域的“现象级”事件。

要知道,字节跳动的Seedance 2.0自2026年2月发布以来,一直是AI视频生成领域的“天花板”般的存在。它凭借强大的多模态处理能力,先后击败OpenAI的Sora 2、Veo 3等知名模型,甚至获得《黑神话:悟空》制作人冯骥“地表最强,没有之一”的高度评价,被业界普遍认为是当前最接近“专业导演级”的AI视频工具。这样一款自带光环的明星模型,被一个匿名新贵轻易超越,不仅让网友炸开了锅,更引发了整个科技圈对HappyHorse-1.0幕后团队的疯狂猜测。
线索的突破口,首先藏在模型的命名和发布套路中。2026年是农历马年,“HappyHorse”(快乐马)的代号自带鲜明的年份印记;而其“匿名上线、低调霸榜”的操作,与今年2月匿名登陆OpenRouter、后续被证实为智谱GLM-5的“Pony Alpha”如出一辙。这两个细节叠加,让“中国团队”成为最主流的猜测方向——毕竟,无论是命名中的文化隐喻,还是“匿名测试、一鸣惊人”的玩法,都与国内AI企业的创新策略高度契合。
但“中国团队”的范围太过宽泛,社交媒体上的猜测很快呈现出“百家争鸣”的态势。有人将目光投向腾讯和阿里,理由是两家企业的创始人都姓马,与“HappyHorse”的命名形成微妙呼应;也有网友倾向于小米,毕竟此前匿名霸榜的模型Hunter Alpha,最终被证实是小米自研的MiMo-V2-Pro,小米“低调布局、突然亮剑”的风格,与HappyHorse-1.0的登场方式高度吻合。更有网友抛出一个有趣的细节:微信在2025年曾推出过一个名为“快乐马”的卡通形象,据此调侃“没准真的是腾讯的手笔”,为这场猜测增添了几分趣味。
随着猜测的深入,两条可信度最高的线索逐渐浮出水面,却又指向了两个截然不同的方向。第一条线索来自X用户Vigo Zhao的技术比对:他将HappyHorse-1.0的公开基准数据——视觉质量4.80、文本对齐4.18、物理一致性4.52、语音字错率14.60%,与当前所有已知模型逐一比对,最终发现其与今年3月底在GitHub开源的daVinci-MagiHuman高度吻合。两者不仅同为150亿参数、40层单流Transformer架构,还同样专注于音视频联合生成,支持的语言列表完全一致,甚至官网的架构描述、演示视频的呈现风格,都像是出自同一套模板。
daVinci-MagiHuman的背后,是Sand.ai与上海创智学院GAIR实验室的联合团队,其核心实力不容小觑。Sand.ai创始人曹越堪称“学术+产业”双料精英,既是清华特等奖学金得主、Swin Transformer共同一作,还是ICCV 2021马尔奖获得者,2023年创立Sand.ai后,便专注于自回归视频生成方向,此前开源的视频大模型MAGI-1已积累了大量行业关注,公司融资规模更是接近六千万美元。从技术传承来看,HappyHorse-1.0作为daVinci-MagiHuman的迭代优化版本,似乎合情合理——毕竟,Sand.ai在自回归视频生成领域的技术积累,足以支撑这样一款“黑马”模型的诞生。

但另一条线索,却将HappyHorse-1.0的归属引向了阿里。多家财经媒体和自媒体爆料,这款匿名模型的背后,是阿里巴巴淘天集团旗下的“未来生活实验室”,由张迪领衔打造。网上流传的一个疑似HappyHorse官方网站,更是明确标注了淘天集团的归属,只不过该网站的真实性尚未得到阿里官方确认。而张迪的履历,更是与AI视频赛道深度绑定:2020年至2025年,他担任快手副总裁,主导搭建了可灵大模型的底层架构,被业界誉为“可灵之父”;2025年短暂加入B站负责技术条线后,又回归阿里执掌未来生活实验室,堪称国内AI视频领域的“老兵”。由他牵头打造HappyHorse-1.0,无论是技术实力还是行业资源,都具备足够的底气。更有知情人士透露,HappyHorse已内部上架阿里百炼MaaS平台,预计一周后正式对外发布,其首位海外社交平台关注者更是阿里巴巴集团本身,这无疑为“阿里系”的猜测增添了重要砝码。
两条线索各有依据,却又相互矛盾,截至目前,无论是Sand.ai还是阿里,都未对HappyHorse-1.0的归属作出任何回应。但在我看来,这种“双重线索”的背后,恰恰反映了当前中国AI视频团队的整体实力——无论是创业公司与科研机构的联合,还是互联网巨头的隐秘布局,都具备了挑战行业天花板的能力。而这种“匿名登场”的方式,与其说是“神秘感”,不如说是国内AI团队的一种“务实策略”:跳出品牌光环的束缚,让模型实力成为唯一的评判标准,这或许也是AI技术回归本质的一种体现。
抛开幕后团队的猜测,更值得关注的是:HappyHorse-1.0的真实实力,是否真的配得上“榜首”的位置?毕竟,Elo评分只是用户盲测的偏好累积,并不完全等同于模型的综合能力。为了探寻真相,我不仅梳理了网上流传的各类实测视频,还在Artificial Analysis平台进行了多次实测,试图还原这款黑马模型的真实水平。
从实测结果来看,HappyHorse-1.0的表现确实有亮点,甚至在部分场景下实现了对Seedance 2.0的超越,但要说“全面领先”,仍有不小的差距。在简单场景的还原上,HappyHorse-1.0的表现堪称精准:比如在打字机场景测试中,它能完美执行提示词中的所有细节——按键逐字打出指定文字、字车滑动发出“叮”声、纸张卷起抽出并放置在旁,甚至能还原出按键咔哒声、抽纸声等细节音效,字迹也相对清晰;而对比模型Kling 2.6 Pro,却未能正确理解“纸张卷起抽出”的动作,表现相形见绌。在建筑师场景中,HappyHorse-1.0更是精准把握了职业特征,让画面中的建筑师在电脑上生成对应图纸,黑眼圈、揉太阳穴等细节还原到位,背景中的键盘敲击声、电脑风扇嗡鸣也十分逼真,展现出强大的场景理解能力。
但在复杂场景和细节处理上,HappyHorse-1.0的短板便逐渐显现。在多人跑步场景测试中,它与Veo 3.1 Preview都存在动作分解不彻底的问题,但HappyHorse-1.0的表现相对更稳定,没有出现Veo 3.1 Preview中“凭空冒出毛巾”的穿帮镜头;可与Seedance 2.0相比,它在人物动作的连贯性、物理规律的合理性上仍有明显差距——比如人物跑步时的肢体摆动幅度不够自然,衣物的动态褶皱还原不够细腻,甚至出现轻微的“漂浮感”,这也是不少测试者质疑其综合实力的核心原因。

更深层次的问题,出在Artificial Analysis的盲测机制本身。这套机制的核心优势的是“去品牌化”,让用户在不知情的情况下仅凭视觉和听觉体验投票,避免了品牌偏好的干扰,也杜绝了模型团队“刷题作弊”的可能,能直接反映普通人的真实感知。但它的结构性局限也同样明显:Elo评分是纯粹的偏好累积,最终结果很大程度上取决于用户提交的测试内容。据统计,目前平台上的盲测素材中,人像生成、口播类内容占比超过60%,而HappyHorse-1.0恰好擅长这类场景,这也成为它能快速登顶的重要原因;反观Seedance 2.0,其核心优势在于多模态融合和复杂叙事,擅长多人物、长时序、复杂运镜的场景,这类场景在盲测中占比较低,自然难以发挥全部实力。
除此之外,投票样本量的差异也影响着排名的客观性。目前,Seedance 2.0仅在文本转视频类别就已积累超过7500次投票,样本量足够大,评分相对稳定;而HappyHorse-1.0作为新上线的模型,投票总量尚未公开,评分的波动性较大。随着更多测试者参与投票,尤其是复杂场景测试内容的增加,两者的排名仍有很大的变动空间。在我看来,HappyHorse-1.0的登顶,更像是“精准踩中了盲测的偏好红利”,而非真正实现了对Seedance 2.0的全面超越——它更像是一款“高质感成片引擎”,擅长打造单一场景的优质内容;而Seedance 2.0则是一套“多模态导演系统”,支持文本、图片、音频、视频四种输入模态,能实现更复杂的叙事和编辑,两者的定位本就不同,单纯用Elo评分来判定“谁更强”,本身就不够严谨。
但无论排名如何变动,HappyHorse-1.0的出现,都为AI视频赛道带来了深远的影响,这也是我认为它最具价值的地方。首先,它打破了“闭源模型垄断榜首”的格局——如果网传的“开源”信息属实,那么这将是开源视频模型首次在用户盲测排行榜上,正面比肩Seedance 2.0这样的主流闭源模型。这不仅意味着开源模型的技术实力正在快速追赶,更打破了“闭源=高质量”的固有认知,为行业发展注入了新的活力。其次,它给用户带来了更多选择,也倒逼行业降低使用门槛。Seedance 2.0的效果虽好,但价格不菲——按照其公布的定价,生成一条15秒的纯生视频,成本约为15元,相当于“一秒一块钱”,且等候时间较长,普通用户和中小商家难以负担;而HappyHorse-1.0若真为开源模型,或将大幅降低用户的使用成本,让AI视频生成技术真正走进更多场景。
从行业格局来看,HappyHorse-1.0的逆袭,也标志着AI视频赛道的竞争进入了“白热化”阶段。此前,字节跳动、快手、昆仑万维等企业已形成梯队优势,Seedance 2.0、可灵3.0、SkyReels V4等模型占据了榜单前列;而阿里的疑似入局,加上Sand.ai等创业团队的发力,让赛道格局变得更加复杂。高盛预测,全球AI视频生成市场规模将从2025年的约30亿美元,增至2030年的约290亿美元,五年增长近10倍,巨大的市场潜力,正在吸引更多企业入局。HappyHorse-1.0的出现,无疑会成为搅动市场的“鲶鱼”,倒逼各大企业加快技术迭代,聚焦用户真实需求,而非单纯追求榜单排名。
更值得思考的是,AI视频模型的核心竞争力,到底是什么?是榜单上的Elo分数,还是真实场景中的落地能力?在我看来,答案显然是后者。无论是Seedance 2.0的“导演级”能力,还是HappyHorse-1.0的“精准场景还原”,最终都要服务于实际应用——比如AI短剧、漫剧制作、企业宣传视频、个人创意创作等。脱离了实际场景的评分,再高也没有实际意义。当前,AI视频生成仍面临诸多痛点:长时序视频的连贯性不足、物理规律还原不够精准、多人物互动自然度低、生成速度慢等,这些问题,都不是靠“优化盲测表现”就能解决的,需要企业投入更多精力在技术研发上,真正突破技术瓶颈。

对于HappyHorse-1.0的幕后团队,无论最终证实是Sand.ai与GAIR实验室的联合,还是阿里淘天的布局,都值得肯定——他们用一款“零宣传”的模型,证明了中国AI视频团队的实力,也为行业发展提供了新的思路。而对于普通用户而言,我们不必过分纠结于“谁是榜首”,更不必迷信榜单排名,选择适合自己需求、性价比高的工具,才是最理性的选择。
展望未来,随着更多企业的入局和技术的不断迭代,AI视频生成技术必将迎来更快的发展,榜单排名也会不断更迭。但无论格局如何变化,只有那些真正聚焦技术创新、贴合用户需求、兼顾实用性和性价比的模型,才能在激烈的竞争中站稳脚跟。而HappyHorse-1.0的逆袭,或许只是一个开始——它告诉我们,在AI领域,没有永远的“天花板”,只有不断的“新突破”,而匿名的光环终会褪去,技术实力才是最终的“通行证”。
夜雨聆风