AI写了一本8万字小说:Nous Research的autonovel全自动写作系统揭秘
2025年初,Nous Research(一家专注于开源AI模型研究的机构)开源了一个叫 autonovel 的项目。他们用它生成了一本79,456字、19章的完整小说——The Second Son of the House of Bells。整个写作过程,人类只提供了一个”种子灵感”,剩下的全由AI自己搞定。
一句话总结:autonovel 是一个让AI像职业作家一样自主写书的”流水线工厂”——它会自己构思世界观、塑造人物、写章节、改稿子,最后还能出PDF、做封面、录有声书。
📌 为什么需要 autonovel?AI 写小说不是新鲜事了
你可能会说:”ChatGPT 也能写故事啊,有什么区别?”
区别大了。现有的AI写作工具,本质上是一个”你问一句、它答一句”的对话模式。你想写长篇小说,得自己一章一章地提示它、检查上下文一致性、修正角色设定偏差。写个几千字还行,写到几万字,角色性格前后矛盾、剧情漏洞百出几乎是必然的。
autonovel 要解决的核心痛点就是:如何让AI在没有人类持续干预的情况下,写出连贯、有深度、质量稳定的长篇小说?
它的灵感来自 Andrej Karpathy(前特斯拉AI总监、OpenAI创始成员)提出的 autoresearch 思路——一个”修改-评估-保留/丢弃”的循环方法论。autonovel 把这个思路用在了小说创作上。
🎯 四阶段流水线:从灵感到出版
autonovel 把整个小说创作拆成了四个阶段,就像一个精密的工厂流水线:
阶段一:打地基(Foundation)
人类只给一个”种子灵感”——可能是一句话、一个场景、一个设定。然后 autonovel 开始自动构建:
📖 世界圣经(World Bible):这个世界的规则、历史、地理、文化是什么样的?
👤 角色档案:每个主要角色的性格、动机、背景故事、说话风格
🗺️ 故事大纲:整本书的情节骨架,起承转合
✍️ 声音指纹(Voice Fingerprint):这本书的写作风格——是冷峻克制,还是华丽浪漫?是快节奏还是慢热?
📋 正典(Canon):不可更改的硬性事实,用来保证全书一致性
这个地基不是一次成型就完事的。系统会循环评估——给当前的地基质量打分,如果分数低于7.5(满分10分),就推倒重来,直到达标为止。
阶段二:写初稿(First Draft)
地基打好了,开始一章一章地写。每写完一章,系统立刻评估质量:
✅ 分数高于6.0?保留,继续下一章。
❌ 分数低于6.0?扔掉重写,最多重试5次。
这个过程最耗时间——据 Nous Research 的估算,一本7.5万字的小说,API调用时间大概在 15到30小时。听起来很长?但想想看,这15个小时里AI在不停地写、评、改、重写,人类不需要盯着。
阶段三:精修(Revision)
初稿完成只是开始。真正让小说出彩的是修改。autonovel 的修改阶段有两条并行的生产线:
3a. 自动精修流水线:
🔍 对抗性编辑——像挑剔的编辑一样,找出冗余、解释过度、陈词滥调的地方
✂️ 执行删减——自动标记需要删除的段落
👥 读者评审团——模拟4种不同读者角色来评价章节(比如”文学评论家””普通读者””类型小说爱好者”)
📝 生成修改简报——汇总所有反馈,生成具体的修改建议
🔄 改写章节——根据简报重写
📊 平台期检测——如果连续几轮修改没有明显提升,自动停止,避免无效循环
3b. Opus 大师评审:
把整本手稿提交给 Anthropic 最强的 Claude Opus 模型,让它扮演两个角色:文学评论家 + 小说系教授。它会给出深度反馈,系统把这些反馈解析成可执行的任务,循环修改直到”重大问题”全部解决。
阶段四:出版(Export)
书稿定稿后,autonovel 不只是输出一个txt文件,而是生成一整套出版素材:
📄 印刷级PDF(用LaTeX排版)
📱 ePub电子书
🎨 封面插画(通过fal.ai生成)
🎙️ 多角色有声书脚本 + 音频(通过ElevenLabs生成多声线配音)
🌐 图书宣传落地页
🏗️ 五层架构:把小说当成一个”活文档系统”
autonovel 最精妙的设计,是把一本小说看作五层互相影响的文档,而不是一堆独立的章节文件。
想象一下盖楼:
🏢 第五层 voice.md—— 写作风格,相当于”建筑的整体设计语言”
🌍第四层 world.md—— 世界观设定,相当于”这块地的地质条件和城市规划”
👥第三层 characters.md—— 角色设定,相当于”每一户居民的人口档案”
📐第二层 outline.md—— 故事大纲,相当于”建筑的结构图纸”
🧱第一层 chapters/—— 实际章节,相当于”一砖一瓦盖起来的实体建筑”
📋贯穿层 canon.md —— 正典(硬性事实),相当于”建筑法规,绝对不能违反”
这个架构的关键在于:改动会双向传播。
比如你在写第三章时发现,主角的背景设定需要调整——那第三层的角色档案要更新,可能第四层的世界观也要补充,第二层的某些大纲节点要重写,甚至可能第一层的已写章节也要回溯修改。autonovel 会追踪这些”传播债务”,记录在 state.json 中,确保整本书始终保持一致性。
💡 类比理解:这就像一个活的维基百科——改了词条A,所有引用词条A的页面都会收到更新提醒。autonovel 把小说的各个要素也做成了这种”互相关联的活文档”。
🛡️ 双重免疫系统:AI写作的质量守门员
AI写小说最容易犯的毛病是什么?陈词滥调、过度解释、所有角色说话像一个模子刻出来的。autonovel 设计了两道质量防线来对抗这些问题:
第一道:机械式检测(evaluate.py)
不靠大模型,纯用规则扫描文本:
🚫 禁用词检测——找出那些被AI滥用的”AI味”词汇
🚫 陈词滥达检测——”他突然意识到””时间仿佛静止了”这类套路表达
🚫 展示而非讲述(Show, Don’t Tell)违规——直接告诉读者”他很悲伤”,而不是通过动作展示
🚫 句子长度均匀——AI容易写出长短一致的句子,缺乏节奏感
从实际生产数据来看,被对抗性编辑砍掉的段落中,“过度解释”占了约32%,”冗余重述”占了约26%。这些正是AI写作最典型的”职业病”。
第二道:LLM评审(evaluate.py)
用另一个独立的大模型来当”评委”,从文学角度打分:
✍️ 文笔质量
🎭 角色区分度(每个角色说话风格是否独特)
📖 情节节拍覆盖度(故事节奏是否到位)
🗣️ 声音指纹匹配度(是否符合预设的写作风格)
更有趣的是”读者评审团”——系统模拟4种不同读者来评价章节。他们发现,有些章节”逻辑上说得通”,但读者觉得角色”像个机制而不是活人”。这种感性层面的判断,纯机械规则是抓不到的,必须靠AI来模拟人类阅读体验。
🔧 技术栈:27个Python脚本撑起的写作工厂
整个系统由27个专门的Python脚本组成,分工非常明确:
🌱 地基组:seed.py(种子处理)、gen_world.py(生成世界)、gen_characters.py(生成角色)、gen_outline.py(生成大纲)、voice_fingerprint.py(提取声音指纹)
✍️写作组:draft_chapter.py(单章写作)、run_drafts.py(批量跑稿)
🔍评估组:evaluate.py(评分)、adversarial_edit.py(对抗编辑)、compare_chapters.py(章节对战,用Elo评分制)、reader_panel.py(读者评审团)
📝修改组:gen_brief.py(生成修改简报)、gen_revision.py(生成修改版)、apply_cuts.py(执行删减)
🎨美术组:gen_art.py(插画)、gen_cover_composite.py(封面合成)、gen_cover_print.py(印刷规格封面)
🎙️音频组:gen_audiobook_script.py(有声书脚本)、gen_audiobook.py(多声线配音生成)
你只需要提供三个API密钥就能跑起来(后两个可选):
🔑 Anthropic API(核心写作和评审,用Claude Sonnet + Opus)
🔑 fal.ai(封面插画,Nano Banana 2模型)
🔑 ElevenLabs(多声线有声书)
🤔 这到底意味着什么?
autonovel 开源的意义,远不止”AI能写小说了”这么简单。
它展示了一种AI-first 的内容生产范式:把创作流程拆解成可评估、可迭代、可自动化的流水线。写小说只是一个应用场景——同样的思路可以用在剧本创作、游戏叙事设计、企业内容营销、教育材料编写等任何需要大规模文本生产的领域。
更重要的是它的质量哲学:不靠”提示工程玄学”来保证输出质量,而是用可量化的评估指标 + 对抗性检测 + 多轮迭代来系统性地提升质量。这是一种工程思维对创意领域的入侵——也许很多人觉得创作不该这么”工业化”,但当AI能以可接受的成本和可预期的质量产出内容时,商业逻辑会推动这个方向不断前进。
📌 核心洞察:autonovel 的真正创新不是”让AI写小说”,而是设计了一套让AI持续自我改进的机制——就像AlphaGo通过自我对弈不断提升棋力,autonovel 通过”写-评-改”的闭环不断提升作品质量。
📊 现实局限:它还不是”小说家杀手”
当然,autonovel 也有明显的局限。Nous Research 自己在项目文档里也坦诚了这些问题:
⏱️ 成本高:一本7.5万字的小说,API费用可能达到数百美元。
🎯 分数追逐有边际效应:修改两轮后,继续修改的提升会越来越小,需要人工判断是否值得继续投入。
🧠 创意天花板:AI很难产生真正颠覆性的创意,它更擅长在既有框架内精耕细作。那种让你读完惊呼”原来故事还能这么讲”的神来之笔,目前还是人类作家的领地。
🎭 情感深度:AI能模拟情感描写,但能否真正”感受”并传达那些微妙的人类体验?这是文学界会长期争论的问题。
所以更准确地说,autonovel 不是来取代小说家的——它是作家的超级工具。你提供灵感和方向,它帮你把想法扩展成完整作品;你做最终的审美判断,它帮你处理那些耗时的技术细节。
💡 我们能从中学到什么?
即使你不是小说作者,autonovel 的设计思路也值得关注:
1️⃣ 模块化 + 可评估 = 可优化:把复杂任务拆成有明确评分标准的环节,才能用自动化手段持续改进。
2️⃣ 双向传播的数据模型:不只是”上层决定下层”,也要允许”下层发现的问题倒逼上层调整”。
3️⃣ 对抗性检测的价值:用规则抓”低级错误”,用AI模拟人类做”高级判断”,两套系统互补。
4️⃣ 知道何时停止:平台期检测机制很关键——不是所有问题都值得无限投入资源去优化。
💬 互动问题:如果你能用 autonovel 让AI帮你写一本书,你最想写什么题材?欢迎在评论区分享你的脑洞!
如果这篇文章对你有启发,欢迎关注,获取更多AI技术前沿解读。
❓ 你觉得 AI 写作未来会取代人类作家,还是成为创作的新工具?留言说说你的看法!
📎 参考资料:
• NousResearch/autonovel GitHub 仓库
• Hermes Agent Autonovel Breakthrough 报道
夜雨聆风