一键生成:Hesmes风格网页、PDF电子书:被AI坑了90次,5分钟出一本书,你也可以出书了……

手搓ebook-maker，5分钟出一本书

终于搞定我的一键生成网页、PDF电子书工具了，长舒一口气！

来吧，先看成品：

已关注

关注

重播分享赞

视频详情

也可以听，播客音频：

进入正题，我们让AI帮忙干点活，感觉它看起来特别忙，文件生了一大堆，最后啥也没出来？

想用AI帮我生成一本电子书。结果它吭哧吭哧干了好几个小时，写了90多个脚本。

我满心期待打开目录一看——check_xxx.py、fix_v1到v6.py、final_xxx.py。

堆了90多个文件，一个能用的PDF都没有。

当时我对着屏幕懵了很久。不是生气，是那种"我是不是傻"的憋屈。

明明这么简单一个需求，怎么就搞不定呢？我甚至开始怀疑是不是自己问的方式不对。

后来我才发现，问题不在AI身上，是我俩分工没分好。AI负责干活没错，但方向得人定。

如果连往哪走、怎么走、走到什么程度算完都没想清楚，它再勤奋也白搭。

这个道理我想明白之后，后面的事就顺了。

你们可能也遇到过这种事 🤔

我先还原一下当时的场景。给AI下了个指令：帮我写一本AI入门的电子书，生成PDF。心想这任务不难吧，AI写东西它擅长啊。

然后它开始了。先写了一个check脚本，跑一下报错。它没去修bug，而是另起一个文件，换了个方法再写。又报错。再起一个文件，再换。

v1写到v6，Chrome打印试到PyMuPDF，试完又去折腾WeasyPrint，最后连xhtml2pdf都翻出来了。

每个写到一半发现走不通就扔在那，再开新的。

到最后一数，90多个脚本，15个测试PDF，全是半成品。😫

我翻了一遍它写的那些代码。说实话，能调接口、能处理PDF、逻辑也完整。

那问题出在哪？没人告诉它"行了，就这个方案往下走"。 它缺的不是技术，是一个喊停的人。

就像你让一个实习生去写方案，他写了十版，每一版方向都不一样。因为他不知道老板想要什么，只能每个方向都试一遍。

你可能觉得：那就换一个更聪明的AI呗。但我想说一个反常识的事：

AI根本不需要更聪明，它需要更好的流程。💡

越聪明的AI自由发挥起来，产生的垃圾越多。就像让一个学霸在没有考纲的情况下写论文——他能写出一百篇，但每一篇都跑题。

你需要的不是更厉害的学霸，是一份写着"考什么、怎么考、多少分算过"的考纲。

这个道理放到你做内容、做产品、做任何事情上都一样。工具强不强是其次，你有没有一套确定的方法才是关键。

想想以前做电子书的经历。你得先搞定排版软件，再琢磨封面设计，然后调CSS调半天，最后处理PDF导出。折腾一整天都未必搞完。

最怕的是排好了发现内容要改，一改版全乱，又得从头来过。那种"花了一天终于排好了→甲方说要改一段→全毁了"的感觉，做过的人都懂。

所以后来我一直在想：这些固定动作能不能全部交给AI，我只管内容方向和质量把关？

重新划了条线，5分钟出一本书 🔧

想清楚之后，我没换工具也没换模型。只做了两件事：第一，想清楚人和AI各自该干什么；第二，把这件事拆成固定的步骤，每一步只做一件事。

我搭了一条流水线，7个阶段串起来。每个阶段人和AI分工明确，互不干扰。

先看生成效果图，内容都一页，格式不同

HTML网页：

PDF电子书：

先花5分钟确认需求。

写给谁看？小白还是有基础？语言风格偏通俗还是偏专业？要不要插图？这些必须人定。

因为只有你才知道你的读者是谁，有什么痛点、想看什么。AI做不了这个判断。

但一旦你定好了，后面所有环节都按这个方向走，不会偏。这5分钟花得值。

再花10分钟做深度调研。让4个AI分头去搜，分别覆盖核心概念、工具方法、行业案例、常见问题。

每个带着明确方向走，回来交报告。这样写出来的东西有根有据，不是瞎编的。

你可能会说：我自己搜不就行了？可以，但你搜一个方向花10分钟，4个方向就是40分钟。AI同时搜，10分钟搞定4个方向，你只需要看摘要做判断。

中间有个动作你得做： 调研结果够不够用？哪些要补充？这个得你扫一眼。AI不知道"够"的标准是什么，只有你知道。

调研够了，花10分钟搭内容架构。

AI出章节大纲：每章标题、覆盖概念、一句话概括。你扫一遍，调调逻辑顺序，往里加你觉得重要的，划掉不必要的。

大纲是AI出的草图，但你的判断才是定稿的尺子。

这句话我想多说一遍：AI可以给你一百种方案，但"选哪个"这个动作，必须你来做。

这就是人和AI最本质的区别——人做选择，AI做执行。🎯

架构定下后，再来规划插图。

定数量和位置，选一个风格，先出一张样图确认。之前那个AI从来不确认，一股脑生成，风格对不对全看命。

这就是没有流程的代价。多花两分钟确认，省后面两小时返工。

全部定好后开始写书，AI跑20分钟。大纲定好之后AI一章一章写。

每章开头有段落概述，每个术语有卡片解释，提示框代码块表格都有统一样式。

排版用了一套固定的CSS模板。封面暖米色加橙色装饰线，目录自动对齐，正文用思源黑体10.5pt，代码块换行不裁边。

封面目录正文封底全部套同一个模板，风格统一。

这一步你完全可以去忙别的。AI写完了会等你回来检查。

写完了，生成PDF只要1分钟。HTML好了之后，用Chrome无头浏览器直接打印成PDF。

然后自动扫描每章位置校准页码、铺满封面背景色、给内容页加居中页码。

第一次打出来的PDF页码多半是乱的——封面和目录占了2页，正文从第3页才开始。

所以流水线先打一版底稿，扫到实际章节位置后更新目录，再打一版定稿。全程自动，不用人碰。

全部跑完，自动出一份交付报告。写明写了多少章、用了多少信源、每个术语怎么解释的、PDF多大。

一清二楚。以后想复现或者优化，直接翻报告看就行。

7个阶段串下来，从开始到拿到PDF，5分钟。没有报错没有反复，一次过。

我把这条流水线打包成了ebook-maker，下次写任何书，说一句话就自动跑完。

我又跑了一次，顺手截了个屏 📹

写这篇文章时我又跑了一遍。3分钟确认需求，10分钟调研，大纲扫一眼说可以。AI开始写，我去倒了杯水。

回来看到它已经写完的那一刻，对比之前90多个脚本那次的郁闷，真的很爽。工具没变，我的用法变了。

然后PDF流水线跑起来：打印、扫章节位置、校页码、铺背景色加页码，一共不到1分钟。最终PDF躺在桌面上，封面目录正文封底全对齐。

生成总耗时不到5分钟。14章、86个术语卡片、22个信源、5.9MB PDF，从0到一本完整的电子书。

这个体量以前纯手工搞，没两天下不来。

而且有个细节让我特别满意：目录页码是自动对的。以前每次做PDF最头疼的就是目录页码——增删一段，后面的页码全变，得手动一个一个改。

现在流水线自动扫一遍，准得很。

差别在哪 ✨

回过头看这两次——一次90个脚本打水漂，一次5分钟出书——区别在哪？不是AI变强了，是我变清楚了。

同一个模型，同一个工具。第一次让它自己看着办，第二次给它铺了条轨道。

就像开车，给一辆好车但没给导航，它能跑但到不了目的地。铺好路了，它自己就能跑到终点。

很多人用AI觉得"也就那样"，问题可能也在这。不是你不行，是分工没理清楚。

你让AI做它不擅长的事（定方向、做选择），又没让它做它擅长的事（批量执行、信息处理），当然觉得难用。

下次用AI之前花5分钟想一想：这件事能拆成几步，哪些要人拍板，哪些让AI自己跑。理清楚了，它会突然变得好用很多。

这就是我一直在说的：AI不是用来装门面的，它是帮你把业务跑通的数字员工。 你先想清楚业务怎么跑，再让AI去跑，而不是反过来。

如果这篇文章有启发，关注辉哥。后面我会继续拆这套工作流的每个阶段。

不只坐而论道，重在起而行之。

PS： 铺好轨道，AI自己会跑。

持续AI实战分享，可复制，可落地。关注辉哥，一路同行！

辉哥AI社群｜OPC实践者 · AI应用实战笔记

#AI编程 #Hermes #电子书制作 #超级个体 #AI工具 #AI写作 #内容创作 #PDF制作