好玩的AI:案例14:哲学经典视觉化!——用AI把《查拉图斯特拉如是说》前言拍成史诗!

声明：【好玩的AI】单独开了一个系列，主体内容来自我，文档生成及排版来自AI工具，旨在记录自己学习AI的实际进展，并且给那些还在犹豫徘徊的读者一点参考。
本期想要传达的主要观点是：从山顶到森林，从绳索到超现实——哲学拍成视频，是不是一个视觉史诗？

📰 一、缘起：是时候试试AI的视频生成功能

我在前面那篇【读书：金观涛&华国凡《控制论与科学方法论》：AI风口下，40年前就有了心法！】，提到：有些书不太好读，AI在某些方面可能是一个不错的帮手。其实《控制论与科学方法论》还算能读得懂，我时不时地还会不自量力地买写难读的书，就比如在【读书：莎拉·贝克韦尔《存在主义咖啡馆》】里面说：“......很不自量地去入手了三本实体书，他们被称为“存在主义三部曲”，分别是尼采的《查拉图斯特拉如是说》、海德格尔的《存在与时间》以及萨特的《存在与虚无》”——但是现在这本相对最易读的《查拉图斯特拉如是说》，我也是翻翻停停，尤其是这本书开篇那么多页的前言，好像剧本似的到底有什么用？——我通过IMA找到了答案，一问再问，这本书似乎就没有那么可怕了。我心里想，有时候文字可能不是最适合的表达方式，比如这本书的前言，如果是个小视频，我可能早就看完了，于是我问腾讯IMA，能把前言的每个小节做成一张图或者一个小视频么？IMA回答如下：

好的，虽然我无法直接生成图像文件，但我可以为你详细描述每张图的画面构思和构图建议。你可以把这些描述交给AI绘图工具去生成。比如：图1：太阳与下山者画面：清晨，山顶上站着一位披着褐色长袍的中年男人（查拉图斯特拉），他面对巨大的初升太阳，双手微张，仿佛在与太阳对话。他身后有一只鹰停在岩石上，脚边盘着一条蛇。背景是层峦叠嶂的群山，前方是蜿蜒通往山下小镇的小路。构图建议：极简主义风格，大片留白，暖金色调（晨曦）人站在画面左侧三分之一处，太阳在右上角鹰的位置要高，蛇的位置要低，形成垂直的视觉张力涵义：我要像太阳一样，把自己献给世人——即使被叫作没落。

我之前的AI 案例确实都集中在信息的处理，对于AIGC中的GC（内容生成）关注不多，那今天就试试，这个题目不错：

用AI视频，视频化尼采的《查拉图斯特拉如是说》～～～～的前言：）

这本书是尼采最晦涩、最富诗意、也最具寓言色彩的作品。它没有严密的论证体系，而是用一系列寓言故事、象征场景和诗性独白，讲述一个哲学家从隐居山林到重返人间的心路历程。要把这样的书变成视频，对提示词的要求极高——因为你不仅需要描述画面，还需要传递隐喻、构图、光影、情绪、甚至镜头运动。而IMA给出的图片提示词，在我看来已经描述得挺细致了，先去看看生成视频的效果如何。

🃏 二、我用的大模型：Agnes 2.0 Flash

这次全程使用的对话模型是Agnes 2.0 Flash（就是这篇【好玩的AI：案例13：薅来的羊毛别放着发霉！3 分钟把免费大模型接进WorkBuddy！】中提到的免费大模型）。整个流程是：

我向Agnes描述场景
Agnes将我的中文描述翻译成英文提示词
调用云端API提交视频生成任务
等待约60~90秒后，视频生成完成并下载到本地

已关注

关注

重播分享赞

视频详情

已关注

关注

重播分享赞

视频详情

已关注

关注

重播分享赞

视频详情

已关注

关注

重播分享赞

视频详情

已关注

关注

重播分享赞

视频详情

💡 整个过程不需要任何视频编辑软件——从创意描述到成品视频，全部在对话中完成。每次生成的视频都在 6~12 MB 之间，分辨率和流畅度在当前阶段已经足够出色。虽然不能和专业影视制作相比，但对于个人创作者来说，这个效率已经让人兴奋。

📡 三、生成前的准备：我对视频的要求，来自于AI对本书的深度拆解

坦白说，对于给AI的prompt（提示词）的要求要比一般的自然语言指令的要求更高一点，就我目前自己的水平来看，在没有剧本没有分镜的情况下，写出一段合格指令是不太可能的——毕竟，AIGC取决于脑子里对场景的理解有多深。

这次用AI工具IMA对《查拉图斯特拉如是说》进行了拆解，帮我梳理出了核心场景和哲学寓意，并且给出了画面描述，每一段都有明确的构图要求、色调要求——甚至镜头运动描述。这些不是凭空想象——而是来自AI对文本的深度理解后，帮我提炼出的核心视觉意象。

🎯 一句话总结：好视频的前提，是你对要拍什么有清晰的理解。
AI不会替你想"拍什么"——它只负责"怎么拍"。

💡 四、我学到了什么？

1. 提示词要写到什么程度？

这是这次实践里最重要的经验。我踩过坑，也总结出规律：

⚠️ 通用原则：提示词不是越短越好，也不是越长越好。关键是——你要描述清楚"画面里有什么"、"怎么布光"、"什么色调"、"镜头怎么动"。

一个好的提示词结构应该是：

[场景描述] + [构图要求] + [色调/光影] + [镜头运动] + [风格标签]

前面提到，《查拉图斯特拉如是说》的提示词，实际上是让AI用生成图片的提示词去生成一段视频，所以，最终的结果虽然是视频，但都是一个静态场景，即便有动效也不在我的意料之内——这就是因为视频生成指令中缺乏了运镜指令——于是我再次测试AI：：

我想做一个视频。是一个男人，在图书馆窗边借着透进来的光看书。镜头从远景推到近景，从男人的侧面平移到手上的这本打开的书。油画风格。

已关注

关注

重播分享赞

视频详情

这次运镜的效果十分贴合地满足了我的要求。

大概总结出一个提示词清单：

必须写： 场景里有什么人/物/动物必须写： 光线从哪来、什么色调必须写： 构图方式（三分法、对角线、对称等）最好写： 镜头运动方式（推、拉、摇、移）最好写： 艺术风格（写实、油画、达利、极简主义）最好写： 动态效果（云在飘、叶子在摇、光束在变化）

📌 记住：AI不是读心者。你描述得越具体，它生成的画面就越接近你脑海中的版本。

2. 当前AI视频生成的局限性

说实话，AI生成的视频还不够精确。文字细节（比如男人看书的书名应该是《查拉图斯特拉如是说》）在生成的视频中可能无法清晰呈现，超现实场景的石板上的刻字也难以准确。但——对于氛围、构图、光影、情绪这类表达，AI已经做得相当好了。

3. 迭代很重要

封面视频我生成了两版。第一版出来后，发现达利风格不够强烈，于是我调整提示词，重新生成——第二版的效果明显更好。这说明：不要期望一次就完美，迭代是AI创作的核心方法论。

🚀 五、未来还能做什么？——拓展场景

这次虽然是用《查拉图斯特拉如是说》做的实验，但这个能力可以应用到非常多的场景：

📖 书籍/论文可视化

任何一本书的核心场景都可以被AI生成视频。小说、哲学著作、学术报告——先让AI拆解核心意象，再用视频呈现。

🎓 课程/演讲配图

课堂上的抽象概念、演讲中的关键论点，都可以用AI视频辅助理解。比PPT生动得多。

🎨 概念艺术/Storyboard

在正式拍摄前，用AI生成场景预览，帮助导演、设计师快速验证创意。

🌍 历史文化还原

古代建筑、历史事件、神话传说——用AI重建那些已经消失的场景。

💼 产品概念演示

还没造出来的产品，可以用AI视频做概念演示，给客户看"想象中的样子"。

🎮 游戏/影视概念预演

游戏场景、影视分镜的快速原型——在投入大量制作成本之前，先用AI验证创意方向。

🔑 当前AI生成视频不够精确，但足够满足大量非精确场景的需求。

🃏 六、总结：一场关于"AI理解深度"的练习

这次项目对我而言，不只是一次AI工具的测试。它更是一场关于"AI的理解深度可以到达什么程度"的练习。

尼采的文字是诗性的、隐喻的、多义的。最终生成的九段视频，加上封面超现实风格的第二版优化，以及油画风格的图书馆场景——总计约70MB的视频素材，覆盖前言部分的完整叙事线。

如果我们愿意投入，是有可能将一本晦涩的哲学书变成看得见的视觉史诗的。

而在这个过程中，无论是文本深入理解，还是分镜头设计，再到视频生成，AI都是能帮得上忙的——所以，你看：AI是不是很好玩？