AI小说生成的尝试,从被动接受工具到主动设计工作流的蜕变之路
我的AI创作之旅始于一个更火热但门槛更高的赛道——AI短剧生成。像”火宝AI短剧”这类工具曾让我心动,但很快意识到,对于毫无视频剪辑、分镜脚本经验的我而言,其技术壁垒过高,生成的结果往往难以达到自我审美的底线。
这促使我将目光投向同一生态下的文字领域:AI小说生成。文字创作对硬件和专业技能的要求相对较低,似乎是一个更可行的切入点。
第一阶段:初探与失控——工具主导下的叙事偏移
我的第一次实践高度依赖现有工具。为了避免API Key泄露风险,并保持本地环境的整洁,我将”火宝小说”的分支项目打包成Docker镜像,部署在家中的x86小主机上。当时该工具主要支持其自有模型,我通过修改代码(codex)为其添加了对其他大模型API的支持,并配置了方舟火山的API Key,开始了首次生成。
首部作品《星际穿越之归航》;创作初衷,是探讨星际航行中因相对论效应导致的时空悲情——归航的勇士面对物是人非的故乡。然而,在AI生成的过程中,这个充满人文关怀的亲情内核,被工具不可控的叙事惯性带偏,最终演变成了一场接一场的星际探险和”用记忆数据拯救自己”的循环套路。
故事完全脱离了预设的大纲,生成内容的逻辑性和一致性出现严重问题。这让我意识到,早期基于简单规则或数据统计的AI生成(如马尔可夫链),其本质是概率预测,缺乏对长线叙事和深层主题的把握。而即使是更先进的深度学习模型,若缺乏有效的约束和引导,也会陷入”跑偏”的困境。
第二阶段:寻求新范式——智能体与动态世界的挑战
随后,我接触了Inkos这类工具。它代表了一种更前沿的思路:通过维护一个不断更新的”真实性文件”来记录小说世界的所有细节(人物、地点、事件等),并利用一个独立的智能体(Agent)实时推测情节发展和动态构建大纲。
这种方法在生成连贯的”钩子”(悬念)和保持世界观一致性上表现优异。然而,其代价是作者对故事走向控制权的削弱。由于大纲是实时、动态生成的,整本书的最终结局变得完全不可预测。这就像将故事托付给一个拥有极高自主权的合作者,虽然能带来惊喜,但也可能彻底背离作者的原始构想。
这与市面上一些新兴的”创作Agent”理念相似,例如”蛙蛙写作”提供的全链路Agent工作流,旨在减少平台切换,但核心仍是让AI深度参与流程决策。
第三阶段:自主改造——融合方法与建立”创作护栏”
连续受挫后,我决定不再被动接受现有工具的设定。我利用AI助手分析了当时(2025年前后)市面主流工具的优缺点。综合测评显示,各类工具各有侧重:
-
有的强于大纲与结构(如DeepSeek、秘塔写作猫)
-
-
-
还有的专攻垂直领域与工作流(如笔灵AI、蛙蛙写作)
但没有一个能完美解决”严格遵循大纲”与”保持创作灵活性”的矛盾。
于是,我从”火宝小说”项目fork了一个分支,开始自主维护和改造。我的核心设计哲学是:为AI的创造力加上明确的”护栏”。具体方案融合了经典的”雪花写作法”与工程化思维:
1. 结构化故事孵化
从一颗”核心种子”(故事核心理念)出发,逐步生成小说架构、世界观、主要角色和关键剧情设计。这借鉴了雪花写作法的精髓,确保故事有一个坚实的逻辑起点。
2. 刚性大纲约束
在写作阶段,要求AI必须严格依据预先生成的、清晰的大纲来生成章节草稿。这旨在从根本上杜绝叙事偏移。
3. 人工审核与真实性维护
生成草稿后,必须经过人工审核和修改。定稿后,系统会自动提取章节中的关键情节、物品、人物关系等信息,维护一份不断增长的”真实性文件”。这份文件虽不如Inkos的完善,但为后续生成提供了上下文记忆,避免了前后矛盾。
终局:云端部署与开放实验
在项目改造后期,我有了一个关键发现:由于核心数据(如人物设定、大纲)是存储在浏览器本地缓存中的,整个应用无需复杂的后端服务器支持。因此,我果断将项目从本地小主机迁移至Cloudflare Pages,部署为一个静态网站。这极大地简化了部署和维护流程。
现在,这个名为novel.waitli.top的实验平台已对外开放。任何用户都可以在上面创建自己的小说项目,唯一的前提是拥有一个支持的大模型API Key。平台兼容包括DeepSeek、智谱AI(GLM系列)、Kimi在内的多个国内主流模型。
总结:从工具使用者到工作流设计者的蜕变
回顾这段历程,我的探索路径清晰地反映了AI辅助创作领域的核心演进:从早期被动接受不可控的输出,到尝试理解动态智能体的新范式,最终走向主动设计融合人类意图与AI能力的工作流系统。
当前,最有效的模式既不是全权委托给AI,也不是完全拒绝AI。而是如众多测评所指出的:将AI定位为”副驾驶”或”灵感放大器”,由作者掌控故事灵魂与核心创意(”核心种子”),利用AI在结构搭建、素材填充、细节润色、甚至突破思维定式方面的强大能力,为故事的血肉赋能。