千问App上新:HappyHorse实测-夜雨聆风

千问App上新:HappyHorse实测

⏰ 全文约 2400 字，阅读约 8 分钟

4月27日，千问App灰测上线 HappyHorse1.0，普通用户终于能自己上手测了。

小白话我把使用反馈、真实实测、价格对比整理了一遍。不吹不黑，看完就能判断这匹马到底值不值得薅。

榜单第一，实际用起来怎么样？

先说结论：榜单分数和实际体验之间，有落差。

怀疑派怎么说？

实际比对后指出，HappyHorse在人物细节、动态连贯性上仍有可见差距。

认为评分过度聚焦特定测试素材——盲测素材里口播与人像内容占比超六成，恰好匹配该模型的训练侧重——无法客观反映复杂场景下的真实生产力。

翻译成人话：考试题目正好是它擅长的，所以分数高。但真到干活的时候，复杂场景下就不一定了。

看好派怎么说？

国联民生证券计算机团队4月9日发布的实测研报给出了三个关键词：场景感、真实感、成片感。认为HappyHorse在氛围营造和画面完整性上确实有优势。

业界普遍预期，后续版本会攻克多镜头序列中的画质一致性难题。

当开放架构的产出质量跨越商用门槛后，社区生态的迭代效率将显著超越封闭体系。

翻译成人话：现在还不完美，但开源+便宜，迟早会迭代到很好用。

设计师实测：四个场景，各有胜负

有设计师做了HappyHorse和Seedance 2.0的对比测试，四个场景，结果很有意思：

测试场景	HappyHorse表现	Seedance 2.0表现
真人步态	视觉吸引力强，动作略僵硬	动作连贯性与真实感更佳
物理规律（抽积木）	效果尚可	受力反馈与运动可信度更稳健
动画风格（毛发/面部）	毛发动态、面部神态、氛围营造显著领先	表现一般
花卉绽放	过程流畅，近看花瓣有合成痕迹	未测试

HappyHorse擅长做出有冲击力的画面——毛发飘动、面部表情细腻、氛围感拉满。

但一到需要严谨物理规律的场景，比如抽积木的受力反馈，就不如Seedance稳。

设计师总结了一句话：HappyHorse很会冲，Seedance更会收。

实测环节：这几个场景，有点意思

目前千问App每天给10个免费额度，能大约生成10个5s长度的720p视频。

小白话我这羊毛不薅白不薅～

入口在哪？

打开千问App（更新到最新版），首页底部有一个HappyHorse按钮。

界面极简：一个输入框，写提示词，点生成，完事。没有花里胡哨的按钮，没有让人眼晕的设置选项。

实测一：产品宣传片-5s版

提示词：”一个精致的白色陶瓷咖啡杯放在原木桌面上，早晨阳光从窗户斜射进来，杯口有热气缓缓升起，背景虚化，商业广告质感，配合语音：精致生活，从早开始”

等了 2 分钟，生成了一条 5 秒的视频，消耗 1 个额度。

已关注

关注

重播分享赞

视频详情

结果：光影效果确实不错，热气上升的物理效果自然，桌面木纹质感清晰。

实测二：给闺蜜做个生日祝福视频

提示词：“一个丰盛的水果生日蛋糕，上面有蜡烛和’Happy Birthday’字样，背景是在家里，有粉色气球和彩带飘动，温馨氛围，配音：“Happy Birthday to you”，一直重复”

等了 2 分钟，生成了一条 5 秒的视频，消耗 1 个额度。

已关注

关注

重播分享赞

视频详情

结果：蛋糕形状大致正确，文字生成——”Happy Birthday”也是正确的，蜡烛的摆动和飘动的黑烟也是合理的，但是这个声音从哪里找来的，有点难听呀🥲

实测三：港风雨夜街头（效果惊艳版）

提示词：”一个穿黑色风衣的男人在雨夜的香港街头行走，霓虹灯招牌闪烁，路面有积水倒影，港片风格，胶片质感”

等了 2 分钟，生成了一条 10 秒的视频，消耗 2 个额度。

已关注

关注

重播分享赞

视频详情

结果：雨滴落在积水上的涟漪清晰可见，霓虹灯在水面的倒影随波纹晃动，男人走路的姿态有王家卫电影的味道。胶片颗粒感自然。

最关键的是——雨声、脚步声、远处的车鸣声，全部自动生成，音画同步。

价格才是真王炸

价格有点香。先看报价：

分辨率	官方刊例价	订阅促销价	对比Seedance 2.0
720P	0.9元/秒	0.44元/秒	约1元/秒，每秒便宜1毛
1080P	1.6元/秒	0.78元/秒	Token计费，约2-4元/秒

什么概念？同样的1080P视频，HappyHorse订阅价0.78元/秒，国内其他主流平台普遍2到4元/秒。直接干到不到三分之一。

对比国外同类产品，这个价格大概是它们的十分之一到五分之一。

功能亮点：三个卖点

1. 音视频联合生成

这是HappyHorse最大的卖点。

大多数AI视频工具只能生成画面，配音和音效需要后期自己加。但HappyHorse是音视频联合生成，一步到位。

马蹄声、风声、雨声，自然同步。不是先生成视频再后期配音。

公开基准数据显示，语音字错率14.60%。虽然不算完美，但在AI生成领域已经能用了。

2. 多镜头叙事能力

它能生成15秒的多镜头视频，不是简单的一段画面从头到尾，而是有镜头切换、有叙事节奏。

但这也是被吐槽最多的点——多镜头序列中的画质一致性还有提升空间。

3. 多画幅适配 + 多参考图融合

竖屏、横屏、方形，都能输出。可以直接发抖音、小红书、朋友圈，不用自己裁剪。

多参考图融合功能：上传多张参考图片，让它融合生成。比如放三张不同角度的产品图，能生成一段完整的产品展示视频。

槽点也有：这些你得知道

当然不是完美的。实测和反馈里提到的问题：

槽点一：单人镜头稳定，画面元素增多后质量骤降

单人镜头表现稳定，但画面元素增多后质量骤降。复杂场景下不推荐。

槽点二：目前只支持最长15 秒视频

目前最长仅支持生成15秒视频，最高分辨率1080P，无法生成4K内容。

槽点三：语音合成有机械感

生成的语音内容仍有一定机械感，情绪表达不够自然。

阿里为什么要在这个时候扔出这匹黑马？

说实话，一个做电商的公司搞视频生成，一开始想不通。但仔细想想，逻辑很清晰。

第一，阿里云需要新的增长引擎

AI视频生成是目前最火的赛道之一。企业客户需要视频内容——广告、宣传、培训、电商详情页，需求量巨大。

谁掌握了最好的视频生成模型，谁就能在云服务市场上切走一大块蛋糕。

第二，千问App需要差异化

国内AI App同质化严重，大家的功能都差不多：聊天、写文案、做PPT、画图。

千问加上HappyHorse之后，直接多了一个能生成视频的能力，而且价格还比竞争对手低一大截。这就是差异化的护城河。

第三，开源是阿里的老套路

HappyHorse和Qwen一样，开放了可商用的开源版本。

这意味着全世界的开发者都可以在它的基础上做二次开发。生态一旦起来，阿里的视频模型就成了行业标准。

总结：要不要薅这个免费额度？

测完一圈，总结三个判断：

如果你平时有做短视频、产品宣传、社交媒体内容的需求，而且不着急——可以薅。免费额度不用白不用，生成效果在同价位里确实能打。

如果你是专业视频创作者，对画质一致性、物理准确性要求高——可以再等等。当前版本在复杂场景下还有明显短板，但开源+低价意味着迭代速度会很快。

2026年的AI视频生成，终于到了一个普通人也能玩的阶段。以前做视频，得学PR 剪辑、 AE 合成，懂剪辑、调色、配乐。

现在呢？打开千问，写一句话，等十几秒，一条带音效的视频就出来了。

这不是替代谁，这是让以前根本不可能做视频的人，也能做了。

至于这匹欢乐马能不能一直欢下去，我们边走边看。

你去薅免费额度了吗？生成效果怎么样？

欢迎在评论区聊聊你的体验。