对你有用的,就是最好的——这才是普通人用AI的终极标准。

昨天做了件事——让龙虾帮我把一份141页的PDF整理成了飞书文档。
这个活如果交给人工,估计得一周,但是 AI 只花了 4 小时(期间还让它做别的任务耽误了半小时)👇。
我把PDF发给礼部尚书(我的龙虾之一,专门处理文档的),说:"帮我把电脑桌面上那个《投资文章精华汇总》整理一下,写到飞书文档里。"
我心想,这应该不难吧,不就是读文件+整理要点嘛,简单。
结果打开文件一看——
好家伙,141页PDF,全是扫描图片格式,一个字都复制不出来 😂
【PDF是扫描件,OCR跑了两次都跪】
礼部尚书决定先试试OCR(光学字符识别),先把图片转成文字再整理。
先是装了easyocr库,准备大干一场。
第一次跑——模型下载到一半,超时了。
第二次跑——内存不足,进程被系统强制杀掉。
连跪两次 😅
最后换了个思路:不用OCR了,直接用视觉识别读图,一张一张看,反而比OCR更稳更快。
图片怎么来的?
等等,你可能好奇,141张图片从哪来的?
是礼部尚书自己用Python的pdfplumber库,从原始PDF文件渲染导出来的。
它跑了一段脚本,把PDF的141页全部转成一张一张的图片,命名成pdf_page_001到pdf_page_141,存在桌面上。
自动化操作,几分钟搞定。这步是整个任务的地基,没有图片,后面什么都读不了。

【开始干活】
然后礼部尚书就开启了"逐页读取+提炼要点"的循环:
读20页 → 停一下 → 整理要点 → 继续读 → 再读20页 → 再停 → 再整理。
新能源汽车、5G通信、东方财富、沪电股份、轨交板块……
整整16个章节,全部写进飞书文档。
但只读了 140 页,礼部尚书读完说"后面没有了"。
我一看:"第141页呢?"
它:……好的,补上。
全部整理完,我又跟它说:"再帮我提炼个投资心法,放到末尾。"
礼部尚书当场愣住——它光顾着复制粘贴,根本没想过要总结 😂
但还是硬着头皮提炼了一下,核心就一句——
"在别人恐惧时研究,在别人贪婪时离场,永远和大多数人反着走。"
有时候,完成任务只是及格,主动多想一步才是满分。
【龙虾自己调用到了哪些工具?】
1. Python + pdfplumber —— PDF转图片
用pdfplumber把141页PDF全部渲染成图片。这是没办法的办法,因为PDF是扫描件,文字提取不出来,只能用图片来读。
2. 视觉识别 —— 直接读图理解
不用OCR,直接读取图片内容。礼部尚书能看懂图片里的文字和图表,准确率很高。
3. 飞书文档 —— 在线写入
用tencent-docs skill直接把内容写进在线文档。我写完打开链接就能看,不用下载不用导出,实时同步。
4. 分批处理 —— 进度管理
任务量大,分批处理。每读20页更新一下进度,心里有数,不容易乱。
一条龙,自动化。
【踩过的坑】
PDF是扫描件——文字提取不出来,得转图片;
OCR跑不通——easyocr依赖有问题,内存不够,直接视觉识别更快;
以为读完了——结果还有漏页没处理;
只整理不复盘——得我提醒才加投资心法,总结才是精华。
【结尾】
整个过程中——
我就是甩手掌柜:发指令、看结果、改需求。
不用自己动手读141页,爽。
所以,有些活儿交给AI真的香。
但记住,AI是执行层,你是把关层。
人机搭配,干活不累。
本人非专业技术人员,若有更好的方案欢迎讨论。


扫码加入龙虾圈子,一起云养虾
夜雨聆风