AI每日新闻——AI音乐进入“翻唱”时代!MiniMax发布Music 2.6,Cover功能和Agent技能同时上线

大家好，我是AI视听小学生。

故事是这样的。

前两天我在刷即刻的时候，看到一个做独立音乐的朋友发了条动态，就一句话，

「我用AI翻唱了自己三年前写的歌，听完以后哭了。」

我当时就愣住了。

不是因为AI有多牛，而是「翻唱自己的歌」这个概念，给我一下子整不会了。

然后我顺着去查了一下，发现MiniMax刚刚发布了新一代音乐生成模型Music 2.6，而这次更新里，最炸的一个功能，就叫Cover。

对，就是翻唱。

AI现在不光能从零生成音乐了，它还能拿着一首已有的歌，换个风格、换个编曲、换种情绪，重新演绎一遍。

坦率的讲，当我真正去试了一圈之后，我觉得这件事的意义，可能比大多数人想象的要大得多。

先说说Music 2.6到底升级了什么。

如果你之前用过AI音乐工具，不管是Suno、Udio还是之前版本的海螺音乐，你一定体验过那种感觉，输入一段描述，等个几十秒，出来一首歌，有时候惊艳，有时候离谱，但大多数时候，你会觉得「差点意思，但又说不上来差在哪」。

Music 2.6这次的升级，我自己的感受是，它在试图解决这个「差点意思」的问题。

延迟大幅缩短。 以前生成一首完整的歌可能要等挺久，现在从输入到出声的链路被压缩了很多。这个看起来是个工程优化，但对创作体验的影响是巨大的，因为音乐创作本质上是一个反复试、反复调的过程，每多等10秒钟，灵感就流失一点。

控制精度提升。 节奏、风格、情感这三个维度的可控性明显变强了。以前你说「我要一首带点忧伤的民谣」，它可能给你一首听起来像是在KTV唱醉了的慢摇。现在它对「忧伤」的理解颗粒度更细了，是淡淡的遗憾，还是撕心裂肺的痛，它开始能分清楚了。

声学质感拉高。 这个怎么说呢，以前AI生成的音乐你一听就知道是AI做的，有一种说不上来的「塑料感」，像是所有乐器都隔着一层保鲜膜在演奏。2.6版本出来的东西，空间感和层次感都好了不少，至少不会让你第一反应是「这是AI吧」。

这三个升级加在一起，核心解决的是一个问题，把AI音乐从「随机开盲盒」往「可控的创作工具」推了一大步。

但说真的，上面这些，都不是让我最兴奋的。

让我最兴奋的是Cover功能。

你想想看，在Music 2.6之前，AI音乐工具的逻辑是什么？是「无中生有」。你给它一段文字描述，它从零开始生成一首歌。这个过程很酷，但有一个根本性的问题，你很难对结果有预期。

就像你跟一个从没见过面的画师说「帮我画一幅夕阳下的海边」，他画出来的东西可能是梵高风格也可能是宫崎骏风格，你没法控制，只能赌。

Cover功能彻底改变了这个逻辑。

它的意思是，你可以拿一首已经存在的歌，让AI用不同的方式重新演绎。换编曲、换风格、换情绪基调、换乐器组合。

这就不是「无中生有」了，这是「有中生变」。

你有了一个锚点，一个参照物，一个起点。你不再是对着一张白纸许愿，而是拿着一幅已有的画说「我想看看它变成油画风会是什么样」。

这个差别太大了。

我试了一下，拿了一首比较简单的民谣，让它用电子风格重新做了一版。出来的东西，骨架还是那首歌，但血肉完全不一样了。原来的木吉他变成了合成器pad，原来的口琴变成了一段带delay的电子音效，整首歌的气质从「坐在草地上弹琴」变成了「凌晨两点的天台」。

说实话我听完有点起鸡皮疙瘩。

不是因为它做得有多完美，而是因为这种「同一首歌的平行宇宙」的感觉，太奇妙了。

你突然意识到，一首歌不是一个固定的东西，它是一个种子，可以在不同的土壤里长出完全不同的样子。

然后我想到了一个更大的事。

Cover这个功能，表面上看是给创作者多了一个玩法，但往深里想，它其实在重新定义「翻唱」这件事本身。

以前翻唱意味着什么？意味着你得有唱功，得有乐队或者至少会编曲，得花时间录音混音。门槛很高。所以翻唱一直是专业音乐人和有才华的业余爱好者的特权。

现在呢？

一个完全不懂乐理的人，可以把自己喜欢的歌用AI重新编排成任何风格。爵士版的周杰伦、摇滚版的邓紫棋、Lo-fi版的凤凰传奇。。。

你敢信？？？

更有意思的是，它不只是给听歌的人用的。对于创作者来说，Cover功能简直是一个「灵感加速器」。

你写了一首歌，觉得还行但总觉得缺点什么。以前你可能得去找不同的编曲师试几个版本，每个版本几千块几万块，还不一定试得出你想要的感觉。现在你可以在5分钟内听到10个完全不同风格的版本，然后突然在第7个版本里发现「卧槽，原来这首歌用Bossa Nova的节奏这么好听」。

这不是替代创作者，这是给创作者装了一个涡轮增压。

再聊聊另一个我觉得被很多人忽略了的功能，Music Skill。

这个东西是面向AI Agent生态的。简单说就是，你的智能体现在可以原生调用音乐创作的能力了。

这意味着什么呢？

我举个例子。你想象一下，你跟一个AI助手说「帮我做一个生日祝福视频给我妈，要温馨一点的」，以前它可能帮你生成文案、配图，但背景音乐这块，要么用版权库里的罐头音乐，要么就没有。

现在，它可以直接给你生成一段原创的、符合「温馨生日」氛围的背景音乐。

整个体验变成了一条龙。

再想远一点。游戏里的NPC能根据剧情实时生成配乐。短视频平台的AI剪辑工具能自动给你的vlog配上风格匹配的原创音乐。播客平台能根据每期内容自动生成片头片尾曲。

Music Skill的意义不在于音乐本身，在于它让音乐变成了AI能力栈里的一个「原子能力」，可以被任何场景随时调用。

这个事情，我觉得还是挺重要的。

顺着上面的再聊聊行业。

AI音乐这个赛道，过去一年多的进化速度是肉眼可见的。

Suno V4发布的时候大家已经很震惊了，觉得AI音乐已经能听了。然后Udio出来，音质又上了一个台阶。再然后Suno V5让整个B站开始文艺复兴。

但如果你仔细看，之前所有的进化都在同一个维度上，就是「生成质量」。音更准了，声更好了，歌词更顺了。

Music 2.6这次做的事不太一样。它不只是在「生成质量」上卷，它在拓展「交互方式」。

Cover功能让用户从「被动接受结果」变成了「基于已有素材进行再创作」。Music Skill让音乐能力从「独立工具」变成了「可嵌入的模块」。

这两个变化指向同一个方向，AI音乐正在从一个「玩具」变成一个「基础设施」。

我自己的感受是，这个转变可能比大多数人预期的要快。

就像当年智能手机刚出来的时候，大家觉得它就是一个能上网的手机。但后来我们发现，它重新定义了通信、社交、支付、出行、娱乐。。。几乎所有事情。

AI音乐可能也在走类似的路。现在大家觉得它就是一个能自动生成歌曲的好玩工具。但当Cover、Music Skill这些能力逐渐成熟，当音乐生成变成一个随处可调用的原子能力的时候，它影响的东西可能远超「音乐」这个领域本身。

对了，还有一个事值得提一下。

Music 2.6现在全球免费内测14天。

这个操作我觉得挺聪明的。让真正的创作者先用起来，拿真实的创作场景去打磨产品，比闷在实验室里调参数有用一万倍。

如果你对AI音乐有兴趣，不管你是做独立音乐的、做短视频的、做播客的、还是纯粹觉得好玩想试试的，我真的建议你去体验一下。

尤其是Cover功能，找一首你最喜欢的歌，让AI给你换个风格重新演绎一遍。那种感觉，怎么说呢，就像你认识了十年的老朋友突然换了个发型，你会觉得「原来你还可以是这个样子」。

最后说点感性的。

我一直觉得，音乐是人类最神奇的发明之一。它不传递信息，不解决问题，不创造物质价值，但它能让一个素不相识的人在三分钟内跟你产生共鸣。

AI介入音乐创作这件事，很多人的第一反应是担忧，觉得音乐的灵魂会被稀释。

我自己的想法是，恰恰相反。

当创作的门槛降低，当更多的人有能力把脑子里的旋律变成真实的声音，我们听到的不会是更少的灵魂，而是更多的、以前被门槛挡在外面的灵魂。

那些在四五线城市出租屋里哼着旋律但不会编曲的年轻人，那些有一肚子故事但不懂乐理的中年人，那些只会用手机但内心有一片海的普通人。

他们的音乐，终于有机会被听到了。

想想就觉得，还挺美好的。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～

谢谢你看我的文章，我们，下次再见。

Tips：有你们的支持，就是我最大的动力~~~