我用AI做了一首《今天教练没骂我》,整个流程拆给你看(附提示词)

不会写歌、不会画画、不会剪视频？没关系，会提问就行

你有没有过这样的时刻——

脑子里有一段旋律，或者一个特别想讲的故事，但想想自己不会作曲、不会画画、不会写分镜，最后只能算了。

我以前也是这样。

直到我开始认真用AI工具，才发现：一个人真的可以是一支队伍。

今天这篇文章，我就把自己从0到1制作音乐短片《今天教练没骂我》的完整过程，像拆乐高一样拆给你看。没有玄学，全是实操。你拿去就能用。

开始前先看一下昨天我做的视频，目前几个平台累计播放量已经过万，分享人数也已经大几百了。

【先花30秒，看懂整个流程】

在做任何事情之前，先搞清楚路线图。整个音乐短片的制作只有5步：

确定主题 → 让AI帮你头脑风暴，出10个创意方案
选定方案 → 让AI写歌词+歌曲风格提示词，去Suno生成音乐
听歌拆解 → 挑出最有画面感的歌词，让AI写分镜脚本
分镜转图 → 让AI把每个分镜变成绘画提示词，生成图片
剪映合成 → 图片+音乐，加转场字幕，成片

是不是比你想象的要简单？下面我们就用真实案例，一步一步走一遍。

【案例：《今天教练没骂我》完整制作过程】

这是一首关于棒球的音乐短片。选它的原因很简单——有反差、有情绪、容易共鸣。谁还没被教练/老师/老板说过几句呢？

【第一步：用AI“偷”创意】

👤 我的提问：“我想写一首关于棒球的歌曲，你能给我一些歌曲创意的灵感吗？”

AI一口气给了我10个方向，比如“最后一球的逆袭”、“棒球场上的友谊”、“默默无闻的捕手”等等。

其中有一个方向，AI特意标注了一句话：

“这个题材有反差感和情绪共鸣，很可能成为爆款。”

它的题目是——《今天教练没骂我》。

我看到这个标题的瞬间就决定了：就是它。一个好的创意，往往就藏在这种“日常但反常识”的细节里。

【第二步：生成歌词 + 歌曲风格（Suno格式）】

👤 我的提问：“就按照《今天教练没骂我》这个方向，帮我写成完整的歌词和对应的style，需要是SUNO网站能识别的格式。”

AI很快给出了完整歌词和[Style]标签，例如：[Genre: Indie Folk Pop] ，[Tempo: Medium] ，[Instrument: Acoustic Guitar, Soft Snare]

第一版出来，音乐听起来不错，但我总觉得少了一点“灵魂”。

这是一首关于孩子的歌，如果能加入孩子的声音，会完全不一样。

👤 我第二次提问：“歌词很棒，但我想在副歌部分加入一些孩子天真、清脆的合唱声音，能让这首歌更打动人。请帮我重新生成包含‘童声合唱’元素的歌曲style。”

AI立刻理解了，修改了style提示词：[Vocal: Male Adult Lead with a Children's Choir in Chorus]

还建议加入口琴、铃鼓等更有童年气息的乐器。

我把新的style和歌词放进Suno生成音乐——效果直接惊艳。那种温暖、治愈、带着一点小骄傲的感觉，一下就出来了。

💡 这里有一个小经验：不要指望AI一次就给你满分答案。不断提需求、迭代优化，才是用好AI的正确姿势。

【第三步：挑一段歌词，让AI写20个分镜镜头】

音乐生成后，我反复听了几遍，选中了副歌部分最触动我的四句：

“今天教练没骂我，太阳公公笑呵呵。挥棒落空也不怕，手套里有我的梦。”

👤 我的提问：“请根据这段歌词，生成一份对应的音乐短片分镜脚本。”

AI直接给我生成了20个详细的分镜镜头。我摘几个给你看：

• 镜头1：清晨的阳光洒在空无一人的棒球场上，一个少年背着比自己还大的球包走进画面。• 镜头5：特写，男孩用力挥棒，球没打中，但他没有沮丧，反而咧嘴笑了。• 镜头10：教练站在远处，没有像往常一样叉腰怒吼，只是微微点了点头。• 镜头15：男孩的手套里，放着一颗棒球和一株小小的四叶草。• 镜头20：夕阳下，男孩和教练的影子被拉得很长，两人并肩走出球场。

读到镜头10的时候，我自己都有点鼻酸。你看，AI并不是冷冰冰的，它完全可以理解情绪和叙事。

【第四步：把20个分镜，变成20个绘画提示词】

现在我们有了分镜脚本，但AI画图工具看不懂“镜头1”这样的描述，需要把它翻译成绘画提示词。

👤 我的提问：“太棒了！请根据上面这20个分镜镜头，给我写出20个可以生成分镜图的提示词。记住，我想要卡通风格的，温暖、治愈一点。”

AI把每个分镜都转化成了高质量的提示词，例如：

对应镜头1的提示词：

卡通风格，宫崎骏式美学，清晨的阳光，空旷的棒球场，内野红土地，绿色外野草坪。一个10岁男孩，背着超大号红色棒球包，走进球场，背影，温暖的氛围，柔和的色彩，高细节，16：9。

对应镜头10的提示词：

卡通风格，皮克斯式渲染，棒球场边，一个看起来严厉但眼神温和的中年教练，他没有说话，只是对远处的小男孩微微点了点头。背景虚化，柔和的光线，充满希望的感觉，16：9。

拿着这20个提示词，去Midjourney、DALL·E 3或Stable Diffusion里生成图片就可以了。

💡 小建议：生成图片时可以多抽几次卡，选最符合你想象的那一张。同一个提示词，不同批次出来的效果也会有差异。

【第五步：剪映合成，大功告成】

最后一步反而最简单：

把生成的20张图片导入剪映
把Suno生成的音乐《今天教练没骂我》拖到音轨上
根据歌词节奏，每张图片设置4-6秒时长
加上简单的“推拉”转场，配上歌词字幕
选一个温暖的滤镜，整体调性统一

一部属于你自己的音乐短片，就这样诞生了。

从“我有一个想法”到成片，全程不需要你会写谱、会画画、会写分镜。你只需要会提问，然后把AI当成你的创意总监、词曲作者、分镜师和画师。

【写在最后：创意才是核心，AI只是工具】

很多人问：AI会不会让我变得没用？

我的答案是：恰恰相反。AI把创作的门槛从“专业技能”降到了“想法和审美”。你不需要苦练十年绘画才能画出分镜，你不需要学五年作曲才能写一首歌。

你需要做的，是有一个好故事，然后知道怎么向AI表达它。

就像《今天教练没骂我》这个案例，它的核心不是什么酷炫的技术，而是一个微小但真实的情绪——那种“今天没有被骂，好像也没有那么差”的、笨拙又可爱的少年心事。

技术的壁垒正在消失，故事的壁垒从未这么低过。

如果你也想试试，就从今天开始吧。把你最想讲的那个故事，交给AI，然后看着它一点点变成画面、变成音乐、变成一部属于你的短片。