大多数人写提示词,跟许愿一样。“写一首伤感的流行歌,女声,要感人一点。”
——这跟“老天爷,给我一个对象”有什么区别?
AI又不是月老,它不认识什么叫“感人”。它只认得:音色、距离、技巧、空间这四件事。

今天学堂微推就跟大家分享四个小技巧,不是什么玄学调参,就是换一套“给AI下指令”的语言。学会了,你的AI歌手立马从“机器人念经”变成“有血有肉在唱歌”。
一、别再只说“好听”,告诉AI“这个声音贴在耳朵边”
大部分人写提示词,只交代风格,不交代距离。
什么叫距离?就是歌手嘴巴离麦克风有多远。
你回忆一下,真人唱歌的时候——情歌,往往是嘴贴着麦克风,换气声、唇齿音都录得清清楚楚,就像在耳边叹气。而一首live感的摇滚,歌手可能离麦半米远,声音带着房间的混响。
但AI默认是什么?是“教科书距离”——不远不近,规规矩矩,没有情绪。
怎么改?在你的提示词里,加一个关键词:close-mic(近距离录音)或者 room mic at 2 meters(两米外的房间麦克风)。
实战一下:
以前你写:
R&B情歌,女声,钢琴
改成:
R&B情歌,intimate close-mic female vocal,钢琴,小房间混响
差别在哪?前者出来的声音像合成器在唱歌;后者出来的人声,有气息声、有唇齿细节,像歌手真的就坐在你对面,捧着耳机在录demo。
二、让AI学会“换气”和“走音”——这才是真人的灵魂
AI歌声一听就假,两大罪魁祸首:一是没气口——唱一整句不换气,铁肺也做不到啊。二是音准完美到可怕——真人唱歌,长音的时候多多少少会飘一点,尤其是情感浓烈的时候。
好消息是,这两个“缺点”,你直接写在提示词里,AI就能学会。
试试加这几个词:
slight breath pause—— 每两句之间,自然吸一口气natural pitch drift—— 允许音高有一点点漂移(就是真人那种“走一点又拉回来”)vocal fry on phrase ends—— 句尾带一点气泡音(就是你说话累的时候,嗓子底部的那个颗粒感)
我有个做音乐的朋友,用这个技巧生成了一首民谣。他给的提示词最后多写了一句:slight breath pause every two lines, vocal fry on ends。
结果出来的歌,他发到朋友圈,底下有人问:“这是哪个独立歌手?声音好有故事。”
他没说这是AI做的。
三、给声线加“人设”:不是“男声女声”,是“温暖的酒吧大叔”和“空灵的森林少女”
只写 male vocal 或 female vocal,AI会给一个最安全、最平庸的默认声线——好听,但没性格。
你要做的,是给这个声音立一个人设。
我整理了几个实测好用的人设,你可以直接拿去改:
温暖大叔:适合民谣、乡村
warm baritone, slightly husky, intimate, like singing in a dim room烟嗓摇滚:适合摇滚、另类
raspy male, gritty, raw, belting with distortion空灵少女:适合梦幻流行、氛围
ethereal female, airy, floating, soft vibrato力量Diva:适合流行大歌
powerful female, belting, chest-dominant, wide dynamics慵懒爵士:适合爵士、沙发音乐
breathy female, laid-back, close-mic, slight delay on sibilance
我自己的经验是:人设定得越具体,AI给的结果越有惊喜。有一次我写了一个“像是凌晨两点在空无一人的酒吧,对着酒杯唱的歌”——它居然真的生成了一段带着淡淡酒意的沙哑嗓音,句末还自己加了一声轻轻的叹息。那一声叹息,提示词里根本没写。
四、最高级的一招:像导演一样,给AI写“剧本”
前面三招,都还是在“设定”。第四招,是真正让AI歌手学会演戏。
方法很简单:在你写的歌词里,用方括号 [ ] 插入演唱指令。
比如你想让副歌那句“别走”唱得撕心裂肺、甚至带一点破音,你就这样写:
[Chorus]别走 ——[crack on this word, almost crying]
AI看到这个指令,就不会平平淡淡地把“别走”唱出来,而是真的在那个字上做一个破音处理——像真人情绪失控时那样。
常用的指令小抄(直接复制):
[Whisper] | |
[Falsetto] | |
[Belting] | |
[Choked] | |
[Crack] | |
[Laughing while singing] | |
[Harmony] |
我见过一个最绝的案例:有个写歌的人,在bridge部分写了 [voice starts to waver, like holding back tears],然后在最后一句写了 [whisper the last word, then a long silence]。
出来的成品,我听了一身鸡皮疙瘩。那个“whisper”之后的三秒空白,比任何乐器都动人。
最后说几句大实话
AI音乐的门槛,从来不是工具贵不贵、技术高不高。是你愿不愿意,把“写提示词”这件事,当成在导演一场表演。
以前的你:
“生成一首好听的歌。”
以后你可以试试这样:
intimate close-mic male vocal, slightly husky, natural breath pause. [Verse: restrained] → [Chorus: emotional crack on high note]. small room reverb.
就这么几处改动。你的AI歌手,就会从“背课文”,变成“开口说话”。
如果你按这几个方法试了,有哪一首生成的结果特别惊喜——欢迎回来告诉我。我也很想听听,你那个AI歌手,第一次“破音”的样子。
夜雨聆风