乐于分享
好东西不私藏

千问App上新:HappyHorse实测

千问App上新:HappyHorse实测

⏰ 全文约 2400 字,阅读约 8 分钟

4月27日,千问App灰测上线 HappyHorse1.0,普通用户终于能自己上手测了。

小白话我把使用反馈、真实实测、价格对比整理了一遍。不吹不黑,看完就能判断这匹马到底值不值得薅。

榜单第一,实际用起来怎么样?

先说结论:榜单分数和实际体验之间,有落差。

怀疑派怎么说?

实际比对后指出,HappyHorse在人物细节、动态连贯性上仍有可见差距。

认为评分过度聚焦特定测试素材——盲测素材里口播与人像内容占比超六成,恰好匹配该模型的训练侧重——无法客观反映复杂场景下的真实生产力。

翻译成人话:考试题目正好是它擅长的,所以分数高。但真到干活的时候,复杂场景下就不一定了。

看好派怎么说?

国联民生证券计算机团队4月9日发布的实测研报给出了三个关键词:场景感、真实感、成片感。认为HappyHorse在氛围营造和画面完整性上确实有优势。

业界普遍预期,后续版本会攻克多镜头序列中的画质一致性难题。

当开放架构的产出质量跨越商用门槛后,社区生态的迭代效率将显著超越封闭体系。

翻译成人话:现在还不完美,但开源+便宜,迟早会迭代到很好用。

设计师实测:四个场景,各有胜负

有设计师做了HappyHorse和Seedance 2.0的对比测试,四个场景,结果很有意思:

测试场景

HappyHorse表现

Seedance 2.0表现

真人步态

视觉吸引力强,动作略僵硬

动作连贯性与真实感更佳

物理规律(抽积木)

效果尚可

受力反馈与运动可信度更稳健

动画风格(毛发/面部)

毛发动态、面部神态、氛围营造显著领先

表现一般

花卉绽放

过程流畅,近看花瓣有合成痕迹

未测试

HappyHorse擅长做出有冲击力的画面——毛发飘动、面部表情细腻、氛围感拉满。

但一到需要严谨物理规律的场景,比如抽积木的受力反馈,就不如Seedance稳。

设计师总结了一句话:HappyHorse很会冲,Seedance更会收。

实测环节:这几个场景,有点意思

目前千问App每天给10个免费额度,能大约生成10个5s长度的720p视频。

小白话我这羊毛不薅白不薅~

入口在哪?

打开千问App(更新到最新版),首页底部有一个HappyHorse按钮。

界面极简:一个输入框,写提示词,点生成,完事。没有花里胡哨的按钮,没有让人眼晕的设置选项。

实测一:产品宣传片-5s版

提示词:”一个精致的白色陶瓷咖啡杯放在原木桌面上,早晨阳光从窗户斜射进来,杯口有热气缓缓升起,背景虚化,商业广告质感,配合语音:精致生活,从早开始”

等了 2 分钟,生成了一条 5 秒的视频,消耗 1 个额度。

已关注

关注

重播 分享

结果:光影效果确实不错,热气上升的物理效果自然,桌面木纹质感清晰。

实测二:给闺蜜做个生日祝福视频

提示词:“一个丰盛的水果生日蛋糕,上面有蜡烛和’Happy Birthday’字样,背景是在家里,有粉色气球和彩带飘动,温馨氛围,配音:“Happy Birthday to you”,一直重复”

等了 2 分钟,生成了一条 5 秒的视频,消耗 1 个额度。

已关注

关注

重播 分享

结果:蛋糕形状大致正确,文字生成——”Happy Birthday”也是正确的,蜡烛的摆动和飘动的黑烟也是合理的,但是这个声音从哪里找来的,有点难听呀🥲

实测三:港风雨夜街头(效果惊艳版)

提示词:”一个穿黑色风衣的男人在雨夜的香港街头行走,霓虹灯招牌闪烁,路面有积水倒影,港片风格,胶片质感”

等了 2 分钟,生成了一条 10 秒的视频,消耗 2 个额度。

已关注

关注

重播 分享

结果:雨滴落在积水上的涟漪清晰可见,霓虹灯在水面的倒影随波纹晃动,男人走路的姿态有王家卫电影的味道。胶片颗粒感自然。

最关键的是——雨声、脚步声、远处的车鸣声,全部自动生成,音画同步。

价格才是真王炸

价格有点香。先看报价:

分辨率

官方刊例价

订阅促销价

对比Seedance 2.0

720P

0.9元/秒

0.44元/秒

约1元/秒,每秒便宜1毛

1080P

1.6元/秒

0.78元/秒

Token计费,约2-4元/秒

什么概念?同样的1080P视频,HappyHorse订阅价0.78元/秒,国内其他主流平台普遍2到4元/秒。直接干到不到三分之一。

对比国外同类产品,这个价格大概是它们的十分之一到五分之一。

功能亮点:三个卖点

1. 音视频联合生成

这是HappyHorse最大的卖点。

大多数AI视频工具只能生成画面,配音和音效需要后期自己加。但HappyHorse是音视频联合生成,一步到位。

马蹄声、风声、雨声,自然同步。不是先生成视频再后期配音。

公开基准数据显示,语音字错率14.60%。虽然不算完美,但在AI生成领域已经能用了。

2. 多镜头叙事能力

它能生成15秒的多镜头视频,不是简单的一段画面从头到尾,而是有镜头切换、有叙事节奏。

但这也是被吐槽最多的点——多镜头序列中的画质一致性还有提升空间。

3. 多画幅适配 + 多参考图融合

竖屏、横屏、方形,都能输出。可以直接发抖音、小红书、朋友圈,不用自己裁剪。

多参考图融合功能:上传多张参考图片,让它融合生成。比如放三张不同角度的产品图,能生成一段完整的产品展示视频。

槽点也有:这些你得知道

当然不是完美的。实测和反馈里提到的问题:

槽点一:单人镜头稳定,画面元素增多后质量骤降

单人镜头表现稳定,但画面元素增多后质量骤降。复杂场景下不推荐。

槽点二:目前只支持 最长15 秒视频

目前最长仅支持生成15秒视频,最高分辨率1080P,无法生成4K内容。

槽点三:语音合成有机械感

生成的语音内容仍有一定机械感,情绪表达不够自然。

阿里为什么要在这个时候扔出这匹黑马?

说实话,一个做电商的公司搞视频生成,一开始想不通。但仔细想想,逻辑很清晰。

第一,阿里云需要新的增长引擎

AI视频生成是目前最火的赛道之一。企业客户需要视频内容——广告、宣传、培训、电商详情页,需求量巨大。

谁掌握了最好的视频生成模型,谁就能在云服务市场上切走一大块蛋糕。

第二,千问App需要差异化

国内AI App同质化严重,大家的功能都差不多:聊天、写文案、做PPT、画图。

千问加上HappyHorse之后,直接多了一个能生成视频的能力,而且价格还比竞争对手低一大截。这就是差异化的护城河。

第三,开源是阿里的老套路

HappyHorse和Qwen一样,开放了可商用的开源版本。

这意味着全世界的开发者都可以在它的基础上做二次开发。生态一旦起来,阿里的视频模型就成了行业标准。

总结:要不要薅这个免费额度?

测完一圈,总结三个判断:

如果你平时有做短视频、产品宣传、社交媒体内容的需求,而且不着急——可以薅。免费额度不用白不用,生成效果在同价位里确实能打。

如果你是专业视频创作者,对画质一致性、物理准确性要求高——可以再等等。当前版本在复杂场景下还有明显短板,但开源+低价意味着迭代速度会很快。

2026年的AI视频生成,终于到了一个普通人也能玩的阶段。以前做视频,得学PR 剪辑、 AE 合成,懂剪辑、调色、配乐。

现在呢?打开千问,写一句话,等十几秒,一条带音效的视频就出来了。

这不是替代谁,这是让以前根本不可能做视频的人,也能做了。

至于这匹欢乐马能不能一直欢下去,我们边走边看。

你去薅免费额度了吗?生成效果怎么样?

欢迎在评论区聊聊你的体验。