先说结论 TLDR
生成式 AI 创作工具让人停不下来,不只是因为有用,也因为每一次生成都带着不确定性。 “提交、等待、揭晓”的过程很像抽卡,偶尔出现的好结果会触发很强的多巴胺奖励感,强化“再来一次”的冲动。 对视觉和创意结果有要求的人,容易卡在“已经不错了,但还差一点”的状态里,因为很多结果很难精确复现或局部修改。 更健康的使用方式,是提前定义什么叫“够用”:限制生成版本数,必要时回到 Photoshop、剪辑等传统工具。

从 Sora 2 开始的那段时间
2025 年秋天 Sora 2 上线之后,我开始高强度使用生成式 AI 工具。那算是我真正密集使用文生视频的开始。
一开始的想法其实很简单。我现在从事市场营销,曾经也做过设计和创意相关的工作。对我来说,文生视频、文生图不只是新玩具,它很可能会改变内容生产、广告创意和品牌表达。
那段时间,我有点发疯成魔地研究提示词。画面怎么描述,镜头怎么运动,视频怎样更接近我脑子里的想法。很多时候,一个生成任务提交之后要等几分钟。那几分钟很奇怪,一边煎熬一边期待。
图片来源:Max Productive AI
过程沉迷
后来我陆续用了很多工具。Veo、Kling、Seedance、Figma Weave,等等数不胜数。刚开始它们几乎都会让我觉得惊艳。以前需要很多步骤、很多软件才能做出来的东西,现在只要写一段提示词,就有一个完整的结果。
但用多了之后,慢慢有一个不原因承认的感受:很多时候,我享受的可能不是最终结果,而是生成的过程。有些图和视频,当下看觉得不错,过几天再看,其实也就是还平均水准。真正让我记住的,反而是提交提示词之后,等它生成的那几分钟。
我不知道它会出来什么。可能完全失败,可能平平无奇,可能只有一个细节很好,也可能突然出现一个让我眼前一亮的版本。这就是生成式 AI 创作工具很特别的地方:你以为你在等待一个结果,其实你是在等待一种可能性。

图片来源:Figma Weave
抽卡式创作
以前用 Photoshop、Illustrator、Figma 这类工具时,我做了什么操作,大体能预期会发生什么。它们可能很复杂,需要练习,但更像是手的延伸。它不会总给你惊喜,但也不会总让你猜。
生成式 AI 不太一样。你写下提示词,提交,然后等待。中间有一段非常明确的空白时间。你不知道系统会把你的描述理解成什么样,也不知道它会在哪里失控,或者在哪里突然超出预期。这个过程有点像抽卡。你知道大多数时候自己会失望,但下一次也有可能会不一样。
这种“下一次可能会更好”的期待,会把人拉住。有时候明明已经生成了十几次,结果都不太行。正准备放弃的时候,突然出来一个画面,光线、构图、氛围都比前面好很多。
那一刻,人会立刻被奖励到,脑子里也会冒出一个危险想法:再来一次。
这可能也是为什么这些工具让人容易停不下来。不是每一次都有好结果,反而正因为好结果不稳定,人才会更期待下一次。这让我想到多巴胺和奖励机制里常说的一个现象:奖励不是每次都出现,而是不确定地出现,期待本身就会变得很有吸引力。
完整结果 vs 不可控
这种感觉相当微妙。生成式 AI 最迷人的地方,是它可以一次性给你一个完整结果。让人感觉自己开启了上帝模式。
但它最折磨人的地方,也正是这里。不是一个每个细节都可控的工程文件,而是一个完整但不完全听话的结果。一个视频可能 80% 都很好,但某个手势不对,转场奇怪,角色的脸突然变了,或者镜头节奏和你想的不一样。这时候你会很痛苦。想修一个小地方,但重新生成之后,其他地方也变了。
对于视觉结果挑剔的人,这个过程会特别煎熬。因为你会一直卡在一种状态里:已经不错了,但还差一点。这个“还差一点”很可怕。如果是传统工具,你也许可以回到时间线里调一帧,在 Photoshop 里修一个局部,或者在 Figma 里改一个组件。但在很多生成式工具里,你面对的是一个整体结果。它给你的是完整性,也拿走了一部分可控性。
两种创作模式的拉扯
所以我现在越来越能感受到两种模式的差别。一种是一次性成型,直接用提示词生成一个完整小短片。这种方式很迷人,因为它真的能让一个原本很复杂的想法快速出现。
另一种是拆成关键帧、镜头和片段,再一点点做。这种方式更可控,但也更费力。某种程度上,它又把人拉回了传统创作流程。你不再只是等待一个完整结果,而是重新开始考虑镜头、节奏和后期处理。
这也是我觉得生成式工具最有意思、也最矛盾的地方。它的优势是让你快速看到一个完整结果,但如果你真的对结果有要求,你很快会发现,看到结果不等于控制结果。它很强,但它还不是你的手。至少在我目前使用的阶段,它更像一个很有想象力、但不完全听话的合作者。
结论:怎么避免无止境生成
这些工具确实打开了很多创意可能,也让我看到了新的表达方式。但我也开始更警惕那种“再来一次”的冲动。因为我越来越觉得,学习 AI 不只是学习怎么生成更好的结果,也包括学习什么时候停下来。
第一个方法,是先定目标。在开始生成之前,先问清楚:这次到底是要做一张图、一个视频片段、一个视觉方向,还是只是做实验?如果它是一个具体任务,我就不能让任务变成无止境的抽卡。
第二个方法,是限制版本数。一轮生成5到8个版本,到了数量就选一个最接近目标的版本。
第三个方法,是放弃一次成型的幻想,回到传统工具。图片可以用 Photoshop 做局部修改,视频可以通过剪辑、裁切、转场、节奏和音乐来解决问题。很多时候,问题不是必须通过再生成一次来解决。传统工具没有消失,只是变成了和 AI 配合的一部分。
如果说以前我以为自己是在用 AI 创作,现在我会更诚实地承认:很多时候,我是在等待下一次惊喜。而真正需要学习的,也许不是永远生成更好的结果,而是在一个已经不错的结果面前,知道什么时候停下来。
TheTokenEra 词元时代
“词元时代”关注 AI 学习、应用、市场营销,以及个人视角的职场思考。不做 AI 资讯,只分享真实的使用和学习感悟。探索新工具怎样影响我们的表达、创作、和工作方式。
夜雨聆风