
昨天晚上,我在B站刷到一个视频。
AI孙燕姿在唱周杰伦的《暗号》。
点开之前我以为会很违和,做好了听恐怖谷效应的心理准备。但前奏一响,那个声音出来的瞬间,我整个人就愣住了。
不是像不像的问题。
是那个声线里的质感,那个咬字的气息感,那个尾音微微上扬的习惯,几乎一模一样。我甚至能想象出她录音时微微歪着头的样子,尽管我知道她根本没录过这首歌。
这也太特么离谱了。
---
你可能觉得我在夸张。但你随便去搜一下,AI孙燕姿、AI周杰伦、AI邓丽君、AI林俊杰,现在网上一搜一大把。从周杰伦唱《向云端》到邓丽君唱《可可托海的牧羊人》,从孙燕姿翻唱陶喆到林志炫翻唱周深,什么组合都有。
有些做得粗糙的,一听就知道是AI,音准飘忽,情绪断裂,像在听一个唱歌跑调的邻居在浴室里自嗨。但有些做得好的,真的是以假乱真。
我印象最深的是一个AI邓丽君唱《起风了》。
按说邓丽君离开我们已经快三十年了,这首歌也跟她那个时代完全不沾边。但那个声音出来的时候,我鸡皮疙瘩起了一胳膊。
怎么说呢,就是那种「她好像真的还在」的感觉。
更离谱的是,我又搜到了一个AI邓丽君唱《孤勇者》。你敢信?陈奕迅的《孤勇者》,去年小学生们在操场上吼的那首,被邓丽君的声音唱出来,居然一点都不违和。那种温柔里带着坚定的感觉,就好像她真的活到了今天,真的录了一版属于自己的《孤勇者》,听的人一下子就不行了。
弹幕里有人写,「我奶奶要是还在,今年也该95了。」
就这一句话,给我整破防了。
我在评论区翻了一会儿,发现很多人跟我的感受一模一样。有人说「听哭了,因为想起了小时候跟我妈一起听邓丽君的日子」,有人说「我知道这不是她唱的,但我不在乎」。还有一个评论特别戳我,「AI复活的不只是声音,是我以为已经死了的那部分自己。」
怎么说呢,那些评论让我感受到一件事,我们嘴上说介意真假,但其实心里最在意的,是那个声音勾起的东西能不能回来。
回来就行。真假是后来的事。
---
我有时候会想一个问题。
我们怀念这些歌手的声音,到底在怀念什么?
孙燕姿出道那会儿是2000年,《天黑黑》火遍大江南北。那时候我还在上学,MP3里全是她的歌。周杰伦更不用说了,从《范特西》到《七里香》,那是整整一代人的青春背景音。
但现在呢?孙燕姿近年很少发歌了,周杰伦的嗓子跟巅峰期确实不太一样了,这没什么不能说的,人都会老,声带会退化,这是自然规律。邓丽君更是已经不在了。
我们的青春偶像们,他们的身体回不去了。
这个事实挺残忍的。你二十岁那年听到《晴天》时的感觉,你初恋分手那晚循环《开始懂了》时的眼泪,那些场景和那些歌是绑在一起的。但歌还是那首歌,人已经不是那个人了。
只不过现在,AI给了我们一个意想不到的选项。
你听AI孙燕姿唱《暗号》,她唱的每一个字都不是她本人录的,但那个音色、那个质感,就是你记忆里的她。她不用再去录音棚,不用再去保护嗓子,不用因为十年二十年后的身体状态跟巅峰期告别。只要模型还在,她的声音就可以一直保持最好的状态。
身体回不去没关系。
你的青春记忆,可以继续赛博生长。
---
但有个问题,我们不得不面对。
AI唱的好像也没比真人差。甚至在某些维度上,比真人还好。
这话听着有点刺耳,但你想啊。一个歌手的状态是有起伏的,今天嗓子不舒服,明天情绪不到位,后天巡演太累了。现场演唱更是玄学,状态好封神,状态差翻车。你去看周杰伦现在的演唱会,他很多高音都不自己唱了,交给观众。
这不是不敬业,是人的生理极限在那摆着。50岁的人不可能有25岁的声带机能,就像40岁的篮球运动员跑不过20岁的新秀,这是写在DNA里的规则。
但AI没有这个限制。
它不需要休息,不需要保护嗓子,不需要倒时差。你给它一首新歌,它就能用孙燕姿的声音唱出来,音准、气息、共鸣全部在黄金状态。它还能用周杰伦25岁时的声线来唱你2025年才听到的歌。
你想想这是什么概念。
那个《范特西》时代的周杰伦,那个声线还是少年感的周杰伦,来唱他现在的歌。这已经不是翻唱了,这是穿越。
所以问题来了。如果AI的版本,在你听来,跟你记忆中的那个歌手几乎没差别,甚至「更好」,那你还会在乎这是AI吗?
我不知道答案。但我觉得这个问题值得多想两分钟。
---
顺着这个往下聊,事情就变得有点意思了。
AI翻唱只是冰山一角。AI孙燕姿、AI周杰伦这些,本质上是在做一个事,用一个人的声音特征去唱另一首歌。技术上其实不复杂,把歌手的录音拆成千上万个音频切片,扔给模型训练,模型学会这个人的声音「长什么样」,然后你给它一段新的音频,它把人声替换成目标歌手的声音,音色、气息、共鸣方式全部重绘。
听起来好像很学术,但你想想看,它做的事情跟一个画家学画很像。画家先临摹一千张莫奈,学会了他的笔触、用色、光影处理,然后自己画一张跟莫奈完全不同的新画,但每一笔都是莫奈的味道。
AI干的事,本质上就是这个。
只不过它「临摹」的速度比人类快一万倍。
但如果我们把这个逻辑再往外推一推呢?
AI写的小说、AI画的图、AI拍的视频、AI生成的纯音乐。
这些东西,在你不知情的情况下,是不是已经让你产生过共鸣了?
我坦率的讲,我自己就中过招。有一回我在一个音乐平台上随机播放,听到一首钢琴曲,觉得特别好听。那种情绪太对了,就是那种黄昏时分、一个人坐在窗边、说不出是忧伤还是平静的感觉。我循环了大半天,去查这个音乐人的信息,想找更多他的作品。结果发现,这首曲子是AI生成的。
我当时的感觉很复杂。
一方面觉得自己被「骗」了,那种「啊原来不是真人创作的」的失落感。但另一方面我不得不承认,那首曲子带给我的情绪共鸣是真实的。我的眼泪不会因为创作者是AI就被系统驳回。
我们的审美系统好像不太在意「谁是作者」这个问题。你的大脑在听到一段旋律时,不会先检查一下这是人写的还是AI写的再决定要不要分泌多巴胺。它就是一个黑盒,输入音波,输出情绪。你控制不了。
我不是说人跟AI创作的东西没有区别。肯定有。而且区别还挺大的。但问题在于,这个区别是不是「你听了之后能不能被打动」这个维度上的关键变量。
至少我现在觉得,不是。
你想想看,本雅明在上世纪三十年代写过一篇文章叫《机械复制时代的艺术作品》,核心观点是艺术品一旦被复制,就失去了它的「灵韵」,那个独一无二的「现场感」。他要是活在今天看到AI生成时代,估计得把眼镜跌碎。因为现在的问题已经不是复制了,是「无中生有」的创造。
那AI生成的艺术品有「灵韵」吗?
我不知道。但我知道我今天下午被一首AI生成的钢琴曲打动了。那个感动是真实的,它来自我的大脑,我的情绪系统,跟我听到真人演奏时的反应机制是同一个东西。
---
往深了想,这就引出一个特别大的问题。
我们说的「创作」、「艺术」、「共鸣」,到底是关于「作品」的,还是关于「创作者」的?
我妈有一次在家庭群里发了一张月亮的照片,构图一般,光线一般,唯一特别的地方就是她手抖了,月亮拍出来有一点重影。但我看到那张照片的时候,鼻子突然一酸。不是因为照片拍得多好,而是因为我认识那个拍照的人,我知道她站在阳台上仰着头举着手机的样子。
那个照片之外的「故事」,才是我真正被触动的部分。
AI生成的艺术作品呢?它没有故事。或者说,它的故事跟作品本身是无关的。你不知道创作者是谁、经历了什么、带着什么情绪在写这首歌。你听到的只是一个「结果」。一个完美的、精准的、但剥离了创作者个人痕迹的结果。
那这种共鸣,跟你在听邓丽君唱《月亮代表我的心》时的共鸣,是同一个东西吗?
我不知道。说实话我也不确定。
但我倾向于认为,它们是两个不同的东西,但都「真实」。
一个是「作品本身打动你」,旋律好听、节奏舒服、文字戳心。你在不知道作者是谁的情况下就可能被打动。
一个是「创作者的故事打动你」,你知道这个人经历了什么,所以那个作品对你来说有额外的重量。
AI给不了后者。起码现在给不了。
但前者,它已经在做了。而且做得不差。
往这个方向再想一步,其实挺有意思的。版权问题先放一边不说,那是法律的事,我们普通人谁说了都不算。但单从「体验」的角度来看,AI翻唱给我们展示了一个很奇妙的可能性,创造力不一定非要从「作者」开始,可以从「你的需求」开始。
你想听孙燕姿唱什么,你就让她唱什么。你想听邓丽君用她独一无二的声线演绎一首从来没唱过的歌,没问题。你的耳朵是遥控器,你的记忆是选歌清单。你不再是听众了,你是博物馆里那个拿着钥匙的巡夜人,你可以决定尘封的展区里哪盏灯亮起来。
这种主动权,以前从来没有过。
---
我有时候在想,这其实也挺好的。
我们这一代人吧,说实话挺尴尬的。喜欢的歌手在变老,喜欢的乐队在解散,喜欢的演员在淡出。我们看着自己青春时代的一个个符号慢慢褪色,却什么也做不了。
但现在AI至少帮我们留住了一些东西。
那些音色、那些声线、那些咬字习惯,它们被模型捕捉、固化、保留了下来。你随时可以回去,听到那个你记忆中的声音。不是让过去的人唱过去的歌,那叫怀旧。是让过去的人唱现在的歌,让怀念变成了另一种意义上的「生长」。
你说那是假的?是的,从技术上说每一帧都是生成的。
可那个声音让你鼻子一酸的感觉,是真的。
你说呢?
夜雨聆风