文生视频 Elo 1333,图生视频 Elo 1402,把此前称霸的字节 Seedance 2.0 甩开近60分。
没有发布会,没有技术博客,没有任何公司背书。一个"连爹是谁都没人知道"的匿名选手,就这么把整个AI视频圈搅得天翻地覆。
更戏剧性的是,就在两周前,OpenAI 刚宣布关停 Sora。那个曾经被吹成"改变世界"的AI视频产品,上线不到一年就凉了。而取代它位置的,是一个神秘到连名字都像玩具的"快乐马"。

"可灵之父"的复仇剧本
直到4月10日,阿里才低调认领:HappyHorse 是阿里 ATH 旗下创新事业部的内测产品,由前快手副总裁、可灵AI技术负责人张迪领衔打造。
等等,张迪?那个"可灵之父"?
没错,就是他。
这哥们的人生轨迹,简直是一部AI圈的"复仇爽文":
2010年加入阿里,在阿里妈妈做了十年广告算法。2020年跳槽快手,一手搭建了可灵大模型体系——业内都叫他"可灵之父"。2025年8月从快手离职,闪电般去了B站,结果待了一个多月就走了。同年11月,他重返阿里,执掌淘天集团未来生活实验室。
从回归到 HappyHorse 登顶全球榜首——只用了五个月。
更微妙的是什么?他打的正是老东家快手和老对手字节的 Seedance。一个做出可灵的人,带着可灵的全部经验,回来做了一个碾压可灵的模型——这不是从零开始,这是"带着满级装备重新开号"。而且时间点太巧了:张迪2025年11月回归阿里,2个月后可灵就被 Seedance 2.0 超越,5个月后 HappyHorse 就杀回了榜单第一。
你说这是巧合?我反正不信。
150亿参数的"三明治",到底强在哪?
技术党别急,这块我给你们掰开了讲。
HappyHorse 1.0 的核心是一个150亿参数的40层单流Transformer架构。听着很吓人对吧?但逻辑其实很简单。

传统模型 vs HappyHorse:两条路 vs 一条路
传统AI视频模型的套路是"两条流水线":一条管画面,一条管声音,最后硬拼在一起。就像拍电影先拍画面,再找配音演员后期配音——嘴型对不上、环境音不自然,是常态。
HappyHorse 的思路完全不同:它把文本、视频帧、音频三种token塞进同一个Transformer序列里联合建模。一次前向推理直接输出带声音的成片,音画天然同步,不需要后期"对轨"。
8步去噪:别人跑30步,它跑8步
更狠的是速度。通过 DMD-2 蒸馏技术,它只需要8步去噪就能完成生成——传统扩散模型动辄几十步。
什么概念?在单张 H100 上,生成一段5秒1080p视频只要38秒。而且原生支持7种语言的唇形同步:英语、普通话、粤语、日语、韩语、德语、法语。
数据来源:Artificial Analysis、国联民生证券研报
匿名打榜:一场精心策划的"谍战片"
HappyHorse 的出场方式,堪称AI圈的"谍战片"。
4月7日,它以完全匿名的身份出现在 Artificial Analysis 的盲测竞技场里。全球数千名用户在完全不知情的情况下"蒙眼二选一"投票——觉得A好就选A,觉得B好就选B。
结果呢?这个连名字都没有的神秘模型,一路碾压 Seedance 2.0、Google Veo 3、快手 Kling 3.0,直接登顶。
整个AI圈都疯了。
"这谁家的模型?""不会是OpenAI的后手吧?""难道是谷歌憋的大招?"
各种猜测满天飞,直到三天后阿里才慢悠悠地认领:"嗯,是我们做的。"
这种"先用硬实力说话,再官宣收割话题"的打法,比花几百万办一场发布会的性价比高太多了。小米的 MiMo-V2-Pro 用"Hunter Alpha"代号低调上线,智谱 GLM-5 以"Pony Alpha"匿名冲榜——匿名打榜,正在成为AI圈的新潮流。
该夸的夸,该泼的冷水也得泼
作为在硅谷和中国AI圈都混过的技术老兵,我得说句公道话。
HappyHorse 确实强,但不是全面碾压。
Artificial Analysis 的盲测机制确实权威——比任何实验室跑分都难刷。但有个已知问题:评测集中人像和口播类内容占比超过60%。HappyHorse 的单流架构在人物口型同步上天然占优,这在一定程度上放大了它的分数优势。
更有意思的是音频赛道。一旦加入音频维度,HappyHorse 和 Seedance 2.0 的分差瞬间收缩到几乎打平。这说明什么?"音视频联合生成"听起来很猛,但在实际音频质量上,并没有甩开 Seedance 的双分支架构。
国联民生证券的实测研报给了一个精准评价:
"HappyHorse 目前更像一个很会拍漂亮镜头的摄影师,但还不是一个真正成熟的动作导演。"场景感、真实感、成片感是它的长板,但动作一复杂,肢体关系错乱、连贯性下降的问题就暴露了。简单说:盲测第一 ≠ 全面领先。该鼓掌鼓掌,该冷静冷静。
开源:这才是让对手睡不着觉的杀招
技术强不强是一回事,但 HappyHorse 真正让整个行业紧张的,是它的开源策略。
HappyHorse 1.0 宣布完全开源——基础模型、蒸馏模型、超分辨率模块、推理代码全部开放,Apache 2.0 商用许可。
这在AI视频赛道是破天荒的。
看看现在的市场格局:
Seedance 2.0 是闭源API,即梦一个月涨价三次;可灵要付费,门槛不低;Runway 更贵。而 HappyHorse 直接把整个武器库扔到了 GitHub 上。
这意味着什么?任何开发者都可以在自己的 H100 上本地部署,不需要按秒付费,不需要担心数据泄露,还可以基于开源权重做垂直微调。
"当前顶尖视频生成模型最大的问题,在于可用性、定价以及过多的限制。如果 HappyHorse 1.0 能通过开源,在可用性、价格和使用限制上做到更优,那它就会是毫无悬念的赢家。" ——CTOL数字解决方案团队这才是让 Seedance 和可灵们真正紧张的地方。当开源模型的效果摸到闭源天花板的那一刻,闭源产品的定价权就开始松动了。
AI视频赛道:一场"王座轮换"的加速游戏
回顾过去两个月,AI视频赛道的榜首像走马灯一样轮换:
数据截至2026年4月10日
与此同时,OpenAI 的 Sora 黯然退场。
这个节奏说明一件事:AI视频生成的技术壁垒,正在从"谁能做"变成"谁做得更快、更便宜、更开放"。技术领先的"保质期"正在急剧缩短——从去年9月至今,几乎每月一次"新王登基"。
写在最后:这匹"快乐马"意味着什么?
HappyHorse 1.0 不会立刻取代 Seedance 2.0,但它证明了三件事:
第一,开源模型已经摸到了闭源模型的天花板。当"可灵之父"带着前东家的全部经验回到老东家,五个月就打出了一个榜首——这个故事本身,比任何技术参数都更让竞争对手睡不着觉。
第二,AI视频赛道远没有终局。Sora 退场、HappyHorse 登顶,说明这个领域依然是"你方唱罢我登场"的混战格局。百度有爱奇艺,腾讯有视频号和腾讯视频——国内还有一批实力派没有真正下场。
第三,人才才是真正的护城河。张迪出走快手5个月,可灵就被 Seedance 超越;回归阿里5个月,HappyHorse 就杀回榜首。在这场AI军备竞赛中,算力可以买,数据可以攒,但顶尖人才的创造力是最难复制的稀缺资源。
💬 聊聊你的看法
你觉得开源AI视频模型会在今年全面超越闭源吗?HappyHorse 如果正式开放,你会第一时间试用吗?评论区等你!
夜雨聆风