最近我在尝试一种新的阅读方式:让 AI 陪我读《红楼梦》。
传统阅读大多是线性的:打开书,一页页读下去,读完以后再靠记忆、批注和笔记慢慢消化。但《红楼梦》这样的经典,信息密度实在太高。人物关系、语言风格、隐喻结构、诗词曲赋层层交织,很多地方读过去了,未必真的读懂了。
微信读书已经提供了 AI 划线问答,这对局部理解很有帮助。但如果想围绕整本书做更连续、更深入的追问,仅靠局部问答还不够。所以,我需要一个更强的阅读 Agent,也需要一份整理好的电子书文本,作为后续对话和分析的基础。
于是,我把 AI 引入了自己的阅读流程,让它变成一个随时可以提问、讨论、拆解文本的“陪读工具”。大致流程如下。
第一步,在微信读书中找到想读的书,比如《红楼梦》。
第二步,在个人阅读和整理的范围内,把页面内容保存为连续图片。这个工具本质上是一个 Node.js CLI + Selenium WebDriver 的自动化脚本:登录微信读书网页版,模拟翻页和随机等待,将电子书页面逐页保存下来。这样,每一张图片就对应书中的一页。
第三步,调用 OCR 工具识别图片中的文字,并转换成 Markdown 格式。相比纯文本,Markdown 更适合后续整理章节、标题、批注和引用。我这一步使用的是 DeepSeek OCR2 模型,PaddleOCR MCP 也是一个不错的选择。
第四步,把每一页识别出来的 Markdown 内容合并,整理成按章节划分的文本。到这里,一份适合与 AI 对话的电子书文本就准备好了。说实话,整个工具的搭建过程,很大程度上也是“用 AI 烧 token ”。
第五步,把整理好的 Markdown 书稿导入 ChatGPT Project,再围绕具体章节和问题展开深入对话。就目前的体验来说,ChatGPT 的深度对话能力,依然是最顺手的。
比如读《红楼梦》第一回时,我问了一个很朴素的问题:
“甄士隐为什么明明是个好人,最后却落得这样悲惨的结局?”
下面是 Chatgpt 给出的回答:

这件事最让我享受的地方,是 AI 把一本原本有点难啃的经典,变成了一个随时可以进去逛一逛、问一问的知识空间。以前读经典,很多疑问我可能就默默放过去了:不知道该问谁,也会担心自己的问题太蠢。现在有了 AI,反而可以很轻松地往那些原本觉得有点艰深的地方多走几步。
夜雨聆风