声明:【好玩的AI】单独开了一个系列,主体内容来自我,文档生成及排版来自AI工具,旨在记录自己学习AI的实际进展,并且给那些还在犹豫徘徊的读者一点参考。
本期想要传达的主要观点是:从山顶到森林,从绳索到超现实——哲学拍成视频,是不是一个视觉史诗?
📰 一、缘起:是时候试试AI的视频生成功能
我在前面那篇【读书:金观涛&华国凡《控制论与科学方法论》:AI风口下,40年前就有了心法!】,提到:有些书不太好读,AI在某些方面可能是一个不错的帮手。其实《控制论与科学方法论》还算能读得懂,我时不时地还会不自量力地买写难读的书,就比如在【读书: 莎拉·贝克韦尔《存在主义咖啡馆》】里面说:“......很不自量地去入手了三本实体书,他们被称为“存在主义三部曲”,分别是尼采的《查拉图斯特拉如是说》、海德格尔的《存在与时间》以及萨特的《存在与虚无》”——但是现在这本相对最易读的《查拉图斯特拉如是说》,我也是翻翻停停,尤其是这本书开篇那么多页的前言,好像剧本似的到底有什么用?——我通过IMA找到了答案,一问再问,这本书似乎就没有那么可怕了。我心里想,有时候文字可能不是最适合的表达方式,比如这本书的前言,如果是个小视频,我可能早就看完了,于是我问腾讯IMA,能把前言的每个小节做成一张图或者一个小视频么?IMA回答如下:
好的,虽然我无法直接生成图像文件,但我可以为你详细描述每张图的画面构思和构图建议。你可以把这些描述交给AI绘图工具去生成。比如:图1:太阳与下山者画面:清晨,山顶上站着一位披着褐色长袍的中年男人(查拉图斯特拉),他面对巨大的初升太阳,双手微张,仿佛在与太阳对话。他身后有一只鹰停在岩石上,脚边盘着一条蛇。背景是层峦叠嶂的群山,前方是蜿蜒通往山下小镇的小路。构图建议:极简主义风格,大片留白,暖金色调(晨曦)人站在画面左侧三分之一处,太阳在右上角鹰的位置要高,蛇的位置要低,形成垂直的视觉张力涵义:我要像太阳一样,把自己献给世人——即使被叫作没落。
我之前的AI 案例确实都集中在信息的处理,对于AIGC中的GC(内容生成)关注不多,那今天就试试,这个题目不错:
用AI视频,视频化尼采的《查拉图斯特拉如是说》~~~~的前言:)
这本书是尼采最晦涩、最富诗意、也最具寓言色彩的作品。它没有严密的论证体系,而是用一系列寓言故事、象征场景和诗性独白,讲述一个哲学家从隐居山林到重返人间的心路历程。要把这样的书变成视频,对提示词的要求极高——因为你不仅需要描述画面,还需要传递隐喻、构图、光影、情绪、甚至镜头运动。而IMA给出的图片提示词,在我看来已经描述得挺细致了,先去看看生成视频的效果如何。
🃏 二、我用的大模型:Agnes 2.0 Flash
这次全程使用的对话模型是Agnes 2.0 Flash(就是这篇【好玩的AI:案例13:薅来的羊毛别放着发霉!3 分钟把免费大模型接进WorkBuddy!】中提到的免费大模型)。整个流程是:
我向Agnes描述场景 Agnes将我的中文描述翻译成英文提示词 调用云端API提交视频生成任务 等待约60~90秒后,视频生成完成并下载到本地 已关注关注重播 分享 赞已关注关注重播 分享 赞
💡 整个过程不需要任何视频编辑软件——从创意描述到成品视频,全部在对话中完成。每次生成的视频都在 6~12 MB 之间,分辨率和流畅度在当前阶段已经足够出色。虽然不能和专业影视制作相比,但对于个人创作者来说,这个效率已经让人兴奋。
📡 三、生成前的准备:我对视频的要求,来自于AI对本书的深度拆解
坦白说,对于给AI的prompt(提示词)的要求要比一般的自然语言指令的要求更高一点,就我目前自己的水平来看,在没有剧本没有分镜的情况下,写出一段合格指令是不太可能的——毕竟,AIGC取决于脑子里对场景的理解有多深。
这次用AI工具IMA对《查拉图斯特拉如是说》进行了拆解,帮我梳理出了核心场景和哲学寓意,并且给出了画面描述,每一段都有明确的构图要求、色调要求——甚至镜头运动描述。这些不是凭空想象——而是来自AI对文本的深度理解后,帮我提炼出的核心视觉意象。
🎯 一句话总结:好视频的前提,是你对要拍什么有清晰的理解。
AI不会替你想"拍什么"——它只负责"怎么拍"。
💡 四、我学到了什么?
1. 提示词要写到什么程度?
这是这次实践里最重要的经验。我踩过坑,也总结出规律:
⚠️ 通用原则:提示词不是越短越好,也不是越长越好。关键是——你要描述清楚"画面里有什么"、"怎么布光"、"什么色调"、"镜头怎么动"。
一个好的提示词结构应该是:
[场景描述] + [构图要求] + [色调/光影] + [镜头运动] + [风格标签]前面提到,《查拉图斯特拉如是说》的提示词,实际上是让AI用生成图片的提示词去生成一段视频,所以,最终的结果虽然是视频,但都是一个静态场景,即便有动效也不在我的意料之内——这就是因为视频生成指令中缺乏了运镜指令——于是我再次测试AI::
我想做一个视频。是一个男人,在图书馆窗边借着透进来的光看书。镜头从远景推到近景,从男人的侧面平移到手上的这本打开的书。油画风格。
这次运镜的效果十分贴合地满足了我的要求。
大概总结出一个提示词清单:
必须写: 场景里有什么人/物/动物必须写: 光线从哪来、什么色调必须写: 构图方式(三分法、对角线、对称等)最好写: 镜头运动方式(推、拉、摇、移)最好写: 艺术风格(写实、油画、达利、极简主义)最好写: 动态效果(云在飘、叶子在摇、光束在变化)
📌 记住:AI不是读心者。你描述得越具体,它生成的画面就越接近你脑海中的版本。
2. 当前AI视频生成的局限性
说实话,AI生成的视频还不够精确。文字细节(比如男人看书的书名应该是《查拉图斯特拉如是说》)在生成的视频中可能无法清晰呈现,超现实场景的石板上的刻字也难以准确。但——对于氛围、构图、光影、情绪这类表达,AI已经做得相当好了。
3. 迭代很重要
封面视频我生成了两版。第一版出来后,发现达利风格不够强烈,于是我调整提示词,重新生成——第二版的效果明显更好。这说明:不要期望一次就完美,迭代是AI创作的核心方法论。
🚀 五、未来还能做什么?——拓展场景
这次虽然是用《查拉图斯特拉如是说》做的实验,但这个能力可以应用到非常多的场景:
📖 书籍/论文可视化
任何一本书的核心场景都可以被AI生成视频。小说、哲学著作、学术报告——先让AI拆解核心意象,再用视频呈现。
🎓 课程/演讲配图
课堂上的抽象概念、演讲中的关键论点,都可以用AI视频辅助理解。比PPT生动得多。
🎨 概念艺术/Storyboard
在正式拍摄前,用AI生成场景预览,帮助导演、设计师快速验证创意。
🌍 历史文化还原
古代建筑、历史事件、神话传说——用AI重建那些已经消失的场景。
💼 产品概念演示
还没造出来的产品,可以用AI视频做概念演示,给客户看"想象中的样子"。
🎮 游戏/影视概念预演
游戏场景、影视分镜的快速原型——在投入大量制作成本之前,先用AI验证创意方向。
🔑 当前AI生成视频不够精确,但足够满足大量非精确场景的需求。
🃏 六、总结:一场关于"AI理解深度"的练习
这次项目对我而言,不只是一次AI工具的测试。它更是一场关于"AI的理解深度可以到达什么程度"的练习。
尼采的文字是诗性的、隐喻的、多义的。最终生成的九段视频,加上封面超现实风格的第二版优化,以及油画风格的图书馆场景——总计约70MB的视频素材,覆盖前言部分的完整叙事线。
如果我们愿意投入,是有可能将一本晦涩的哲学书变成看得见的视觉史诗的。
而在这个过程中,无论是文本深入理解,还是分镜头设计,再到视频生成,AI都是能帮得上忙的——所以,你看:AI是不是很好玩?
夜雨聆风