乐于分享
好东西不私藏

国内那些能把话说“好看”的AI工具

国内那些能把话说“好看”的AI工具

点击蓝字
默默关注

上回聊完几个大模型,朋友继续问我:“你说的那些AI能写文章、能聊天,那有没有能画图、能做视频的?我想做个短视频,或者给文章配个图,能不能让AI帮忙?”

上次说的豆包就可以,而且国内的这类工具已经不少了,各有各的玩法,我继续说几个——

即梦

字节跳动在视频生成这块,国内领先。它的即梦网站,文生图和文生视频是强项。

为什么强?因为字节有抖音。抖音上有海量的视频数据,AI学了个遍,所以它对动态画面、镜头语言的理解特别深。生成的视频流畅度高,创意也好。

而且字节的产品向来用户体验好,界面友好,上手快,年轻人用起来很顺手。还有个好处是社区氛围好,大家把自己的作品分享出来,互相学习。

注意,即梦在生成视频的时候需要消耗积分。它固定时间给你一点让你免费使用,大量使用就要花钱了。

即梦App的图标设计为一个‌陀螺形状‌,这一设计灵感来源于电影《盗梦空间》中用于区分梦境与现实的图腾道具——陀螺 在电影里,陀螺转动,梦境开始;陀螺倒下,回到现实。不得不说,这个理念和设计都很搭。

可灵

说起抖音,自然会想到快手。这两家公司从开始就竞争激烈,一直到现在的AI大模型,它们还在较劲。

这不,可灵问世。它也专注于文生视频和图生视频。

快手的短视频数据同样海量,而且快手的内容更“接地气”,对真实世界的动态捕捉能力强。可灵生成的视频在物理逻辑和人物动作的自然度上表现很好,看着比较“真”。

它还较早地开放了API接口,开发者和企业可以拿它去做二次开发。

缺点是生态比较单一,主要就是视频生成,图像等其他功能相对弱一些。抖音还一个豆包呢……

通义万相

通义万相是阿里通义千问系列里的多模态工具,主打文生图。

它的最大优势是跟阿里巴巴的电商生态结合紧密——淘宝、天猫。你如果想生成商品图、营销海报、产品展示图,用它特别合适。它提供丰富的风格选择和参数调节,可控性强,商业应用很友好。

底层模型依托达摩院,迭代速度快,技术底子不错。

但面向普通消费者的产品,易用性和趣味性稍弱一些。文生视频功能还在快速迭代中,公开版本的能力有待加强。

写到这有没有发现,依旧是“大厂”之间的竞争,对于这些科技互联网公司,唯有不断创新,内卷,才能抢夺用户。但大家各有各的生态,短时间侵占谁并不容易。

腾讯混元

腾讯混元的多模态能力正在逐步集成到腾讯文档、微信小程序、腾讯云等产品中。

它最大的潜力是跟微信、QQ的结合。未来你在微信里就能直接用它生成图片、视频,方便在社交场景中创作和传播。在游戏、广告、社交内容创作方面,腾讯有天然优势。

另外,腾讯在内容审核和安全合规方面做得比较严格,生成的内容不容易出问题。

但目前独立的AIGC创作平台入口不那么明显,更多是把能力嵌入到各个产品里。在生成效果的“炫技”方面,宣传和展示相对低调。

美图秀秀

美图秀秀大家都不陌生。靠修图作图起家。目前它的AI功能主打AI绘画、AI视频、AI设计。

它的优势是用户基数大,推广快。针对手机拍照、修图、短视频场景深度优化,操作简单。而且美图在审美上一直在线,生成的图像和视频风格更符合大众审美,尤其是在人像、艺术风格方面。

但它的专业度不足。生成的素材分辨率和专业可控性不如专业平台,更适合娱乐和社交分享。功能更偏向“一键生成”,深度定制能力较弱。

剪映

这款又来自抖音生态,剪映跟上面几个不太一样。它不是纯粹的“从文字生成视频”的工具,而是一个集成了强大AI功能的视频创作工具。

它的核心是智能编辑。比如智能抠像——一键移除视频背景;AI字幕——自动识别语音生成字幕;智能配音——输入文字生成自然的人声;AI数字人——创建自己的数字人分身播报;智能剪辑——自动识别视频中的高光片段,或者根据音乐节奏自动卡点。

但它的核心优势是“编辑”而非“生成”。在纯粹的、高质量的原生内容生成方面,跟专用工具还有差距。但对于普通视频爱好者,这是入门必备工具之一。我就是深度用户。

这阵子聊了不少关于AI的东西,从它是什么、怎么学的,到有哪些好用的工具。真是意犹未尽呐!每用好一个,都需要花费不少精力。

那天看到一句话说,AI来了,我们加班的时间更长了。深有感触,AI拓展了人类的欲望边界,它看似提升了效率,但在时间这个轮回里面,只不过是加速重复而已。

人呐,不要被AI蒸馏了……我想未来肯定会有一波反AI的潮流,咱拭目以待。


文中图片由豆包AI生成

👇👇👇

你我相遇,绝非偶然