国内那些能把话说“好看”的AI工具

点击蓝字

默默关注

上回聊完几个大模型，朋友继续问我：“你说的那些AI能写文章、能聊天，那有没有能画图、能做视频的？我想做个短视频，或者给文章配个图，能不能让AI帮忙？”

上次说的豆包就可以，而且国内的这类工具已经不少了，各有各的玩法，我继续说几个——

即梦

字节跳动在视频生成这块，国内领先。它的即梦网站，文生图和文生视频是强项。

为什么强？因为字节有抖音。抖音上有海量的视频数据，AI学了个遍，所以它对动态画面、镜头语言的理解特别深。生成的视频流畅度高，创意也好。

而且字节的产品向来用户体验好，界面友好，上手快，年轻人用起来很顺手。还有个好处是社区氛围好，大家把自己的作品分享出来，互相学习。

注意，即梦在生成视频的时候需要消耗积分。它固定时间给你一点让你免费使用，大量使用就要花钱了。

即梦App的图标设计为一个‌陀螺形状‌，这一设计灵感来源于电影《盗梦空间》中用于区分梦境与现实的图腾道具——陀螺。在电影里,陀螺转动,梦境开始;陀螺倒下,回到现实。不得不说，这个理念和设计都很搭。

说起抖音，自然会想到快手。这两家公司从开始就竞争激烈，一直到现在的AI大模型，它们还在较劲。

这不，可灵问世。它也专注于文生视频和图生视频。

快手的短视频数据同样海量，而且快手的内容更“接地气”，对真实世界的动态捕捉能力强。可灵生成的视频在物理逻辑和人物动作的自然度上表现很好，看着比较“真”。

它还较早地开放了API接口，开发者和企业可以拿它去做二次开发。

缺点是生态比较单一，主要就是视频生成，图像等其他功能相对弱一些。抖音还一个豆包呢……

通义万相是阿里通义千问系列里的多模态工具，主打文生图。

它的最大优势是跟阿里巴巴的电商生态结合紧密——淘宝、天猫。你如果想生成商品图、营销海报、产品展示图，用它特别合适。它提供丰富的风格选择和参数调节，可控性强，商业应用很友好。

底层模型依托达摩院，迭代速度快，技术底子不错。

但面向普通消费者的产品，易用性和趣味性稍弱一些。文生视频功能还在快速迭代中，公开版本的能力有待加强。

写到这有没有发现，依旧是“大厂”之间的竞争，对于这些科技互联网公司，唯有不断创新，内卷，才能抢夺用户。但大家各有各的生态，短时间侵占谁并不容易。

腾讯混元的多模态能力正在逐步集成到腾讯文档、微信小程序、腾讯云等产品中。

它最大的潜力是跟微信、QQ的结合。未来你在微信里就能直接用它生成图片、视频，方便在社交场景中创作和传播。在游戏、广告、社交内容创作方面，腾讯有天然优势。

另外，腾讯在内容审核和安全合规方面做得比较严格，生成的内容不容易出问题。

但目前独立的AIGC创作平台入口不那么明显，更多是把能力嵌入到各个产品里。在生成效果的“炫技”方面，宣传和展示相对低调。

美图秀秀大家都不陌生。靠修图作图起家。目前它的AI功能主打AI绘画、AI视频、AI设计。

它的优势是用户基数大，推广快。针对手机拍照、修图、短视频场景深度优化，操作简单。而且美图在审美上一直在线，生成的图像和视频风格更符合大众审美，尤其是在人像、艺术风格方面。

但它的专业度不足。生成的素材分辨率和专业可控性不如专业平台，更适合娱乐和社交分享。功能更偏向“一键生成”，深度定制能力较弱。

这款又来自抖音生态，剪映跟上面几个不太一样。它不是纯粹的“从文字生成视频”的工具，而是一个集成了强大AI功能的视频创作工具。

它的核心是智能编辑。比如智能抠像——一键移除视频背景；AI字幕——自动识别语音生成字幕；智能配音——输入文字生成自然的人声；AI数字人——创建自己的数字人分身播报；智能剪辑——自动识别视频中的高光片段，或者根据音乐节奏自动卡点。

但它的核心优势是“编辑”而非“生成”。在纯粹的、高质量的原生内容生成方面，跟专用工具还有差距。但对于普通视频爱好者，这是入门必备工具之一。我就是深度用户。

这阵子聊了不少关于AI的东西，从它是什么、怎么学的，到有哪些好用的工具。真是意犹未尽呐！每用好一个，都需要花费不少精力。

那天看到一句话说，AI来了，我们加班的时间更长了。深有感触，AI拓展了人类的欲望边界，它看似提升了效率，但在时间这个轮回里面，只不过是加速重复而已。

人呐，不要被AI蒸馏了……我想未来肯定会有一波反AI的潮流，咱拭目以待。

文中图片由豆包AI生成

👇👇👇

你我相遇，绝非偶然