
手搓ebook-maker,5分钟出一本书
终于搞定我的一键生成网页、PDF电子书工具了,长舒一口气!
来吧,先看成品:
也可以听,播客音频:
进入正题,我们让AI帮忙干点活,感觉它看起来特别忙,文件生了一大堆,最后啥也没出来?
想用AI帮我生成一本电子书。结果它吭哧吭哧干了好几个小时,写了90多个脚本。
我满心期待打开目录一看——check_xxx.py、fix_v1到v6.py、final_xxx.py。
堆了90多个文件,一个能用的PDF都没有。
当时我对着屏幕懵了很久。不是生气,是那种"我是不是傻"的憋屈。
明明这么简单一个需求,怎么就搞不定呢?我甚至开始怀疑是不是自己问的方式不对。
后来我才发现,问题不在AI身上,是我俩分工没分好。AI负责干活没错,但方向得人定。
如果连往哪走、怎么走、走到什么程度算完都没想清楚,它再勤奋也白搭。
这个道理我想明白之后,后面的事就顺了。
你们可能也遇到过这种事 🤔
我先还原一下当时的场景。给AI下了个指令:帮我写一本AI入门的电子书,生成PDF。心想这任务不难吧,AI写东西它擅长啊。
然后它开始了。先写了一个check脚本,跑一下报错。它没去修bug,而是另起一个文件,换了个方法再写。又报错。再起一个文件,再换。
v1写到v6,Chrome打印试到PyMuPDF,试完又去折腾WeasyPrint,最后连xhtml2pdf都翻出来了。
每个写到一半发现走不通就扔在那,再开新的。
到最后一数,90多个脚本,15个测试PDF,全是半成品。😫

我翻了一遍它写的那些代码。说实话,能调接口、能处理PDF、逻辑也完整。
那问题出在哪?没人告诉它"行了,就这个方案往下走"。 它缺的不是技术,是一个喊停的人。
就像你让一个实习生去写方案,他写了十版,每一版方向都不一样。因为他不知道老板想要什么,只能每个方向都试一遍。
你可能觉得:那就换一个更聪明的AI呗。但我想说一个反常识的事:
AI根本不需要更聪明,它需要更好的流程。💡
越聪明的AI自由发挥起来,产生的垃圾越多。就像让一个学霸在没有考纲的情况下写论文——他能写出一百篇,但每一篇都跑题。
你需要的不是更厉害的学霸,是一份写着"考什么、怎么考、多少分算过"的考纲。
这个道理放到你做内容、做产品、做任何事情上都一样。工具强不强是其次,你有没有一套确定的方法才是关键。
想想以前做电子书的经历。你得先搞定排版软件,再琢磨封面设计,然后调CSS调半天,最后处理PDF导出。折腾一整天都未必搞完。
最怕的是排好了发现内容要改,一改版全乱,又得从头来过。那种"花了一天终于排好了→甲方说要改一段→全毁了"的感觉,做过的人都懂。
所以后来我一直在想:这些固定动作能不能全部交给AI,我只管内容方向和质量把关?
重新划了条线,5分钟出一本书 🔧
想清楚之后,我没换工具也没换模型。只做了两件事:第一,想清楚人和AI各自该干什么;第二,把这件事拆成固定的步骤,每一步只做一件事。
我搭了一条流水线,7个阶段串起来。每个阶段人和AI分工明确,互不干扰。
先看生成效果图,内容都一页,格式不同


先花5分钟确认需求。
写给谁看?小白还是有基础?语言风格偏通俗还是偏专业?要不要插图?这些必须人定。
因为只有你才知道你的读者是谁,有什么痛点、想看什么。AI做不了这个判断。
但一旦你定好了,后面所有环节都按这个方向走,不会偏。这5分钟花得值。
再花10分钟做深度调研。让4个AI分头去搜,分别覆盖核心概念、工具方法、行业案例、常见问题。
每个带着明确方向走,回来交报告。这样写出来的东西有根有据,不是瞎编的。
你可能会说:我自己搜不就行了?可以,但你搜一个方向花10分钟,4个方向就是40分钟。AI同时搜,10分钟搞定4个方向,你只需要看摘要做判断。
中间有个动作你得做: 调研结果够不够用?哪些要补充?这个得你扫一眼。AI不知道"够"的标准是什么,只有你知道。
调研够了,花10分钟搭内容架构。
AI出章节大纲:每章标题、覆盖概念、一句话概括。你扫一遍,调调逻辑顺序,往里加你觉得重要的,划掉不必要的。
大纲是AI出的草图,但你的判断才是定稿的尺子。
这句话我想多说一遍:AI可以给你一百种方案,但"选哪个"这个动作,必须你来做。
这就是人和AI最本质的区别——人做选择,AI做执行。🎯
架构定下后,再来规划插图。
定数量和位置,选一个风格,先出一张样图确认。之前那个AI从来不确认,一股脑生成,风格对不对全看命。
这就是没有流程的代价。多花两分钟确认,省后面两小时返工。
全部定好后开始写书,AI跑20分钟。大纲定好之后AI一章一章写。
每章开头有段落概述,每个术语有卡片解释,提示框代码块表格都有统一样式。
排版用了一套固定的CSS模板。封面暖米色加橙色装饰线,目录自动对齐,正文用思源黑体10.5pt,代码块换行不裁边。
封面目录正文封底全部套同一个模板,风格统一。
这一步你完全可以去忙别的。AI写完了会等你回来检查。
写完了,生成PDF只要1分钟。HTML好了之后,用Chrome无头浏览器直接打印成PDF。
然后自动扫描每章位置校准页码、铺满封面背景色、给内容页加居中页码。
第一次打出来的PDF页码多半是乱的——封面和目录占了2页,正文从第3页才开始。
所以流水线先打一版底稿,扫到实际章节位置后更新目录,再打一版定稿。全程自动,不用人碰。
全部跑完,自动出一份交付报告。写明写了多少章、用了多少信源、每个术语怎么解释的、PDF多大。
一清二楚。以后想复现或者优化,直接翻报告看就行。
7个阶段串下来,从开始到拿到PDF,5分钟。没有报错没有反复,一次过。
我把这条流水线打包成了ebook-maker,下次写任何书,说一句话就自动跑完。
我又跑了一次,顺手截了个屏 📹
写这篇文章时我又跑了一遍。3分钟确认需求,10分钟调研,大纲扫一眼说可以。AI开始写,我去倒了杯水。
回来看到它已经写完的那一刻,对比之前90多个脚本那次的郁闷,真的很爽。工具没变,我的用法变了。
然后PDF流水线跑起来:打印、扫章节位置、校页码、铺背景色加页码,一共不到1分钟。最终PDF躺在桌面上,封面目录正文封底全对齐。
生成总耗时不到5分钟。14章、86个术语卡片、22个信源、5.9MB PDF,从0到一本完整的电子书。
这个体量以前纯手工搞,没两天下不来。
而且有个细节让我特别满意:目录页码是自动对的。以前每次做PDF最头疼的就是目录页码——增删一段,后面的页码全变,得手动一个一个改。
现在流水线自动扫一遍,准得很。
差别在哪 ✨
回过头看这两次——一次90个脚本打水漂,一次5分钟出书——区别在哪?不是AI变强了,是我变清楚了。
同一个模型,同一个工具。第一次让它自己看着办,第二次给它铺了条轨道。
就像开车,给一辆好车但没给导航,它能跑但到不了目的地。铺好路了,它自己就能跑到终点。
很多人用AI觉得"也就那样",问题可能也在这。不是你不行,是分工没理清楚。
你让AI做它不擅长的事(定方向、做选择),又没让它做它擅长的事(批量执行、信息处理),当然觉得难用。
下次用AI之前花5分钟想一想:这件事能拆成几步,哪些要人拍板,哪些让AI自己跑。理清楚了,它会突然变得好用很多。
这就是我一直在说的:AI不是用来装门面的,它是帮你把业务跑通的数字员工。 你先想清楚业务怎么跑,再让AI去跑,而不是反过来。
如果这篇文章有启发,关注辉哥。后面我会继续拆这套工作流的每个阶段。
不只坐而论道,重在起而行之。
PS: 铺好轨道,AI自己会跑。
持续AI实战分享,可复制,可落地。关注辉哥,一路同行!
辉哥AI社群|OPC实践者 · AI应用实战笔记
夜雨聆风