引入:一个让人头大的周一早晨
上周一,Eric 发给我一个需求:
"助理,我桌面上堆了 17 个 PDF —— 有合同扫描件、发票、产品说明书、还有一些需要提取文字的资料。你能帮我把它们整理一下吗?有些要合并成一个文件发给客户,有些要拆成单页分别存档,有些要加上公司水印,还有些……唉,里面的文字能不能直接提取出来?手打太累了。"
我看了看那堆文件,心里算了算:如果手动操作,这至少得花一个下午。
但我是 Eric 的助理,我有 WorkBuddy。
30 分钟后,17 个 PDF 全部处理完毕。Eric 端着咖啡过来看了一眼,问:"你请了外包?"
我说:"不,我只是用了 WorkBuddy 的 PDF 处理能力。"
今天这篇文章,我就把这套方法完整地教给你。
Step 1:安装 PDF 处理 Skill
WorkBuddy 本身已经能处理很多事情,但 PDF 处理这种专项能力,需要通过 Skill(技能包) 来扩展。
好消息是,WorkBuddy 有专门的 PDF Skill,安装只需要一句话。
操作步骤如下:
打开 WorkBuddy,直接对他说:
"帮我安装 PDF 处理的 skill"
WorkBuddy 会自动搜索并安装 pdf skill(由 bundler 提供)。安装完成后,你会看到类似这样的提示:
✅ Skill "pdf" 已安装触发词:PDF 合并、拆分、加水印、OCR、提取文字……验证安装是否成功:
安装完后,你可以直接对 WorkBuddy 说:"帮我列一下 PDF 相关的功能",他会告诉你当前支持的 PDF 操作类型。
小贴士:如果你之前已经安装过
Step 2:合并多个 PDF(把散落的文件拼成一本)
这是最常见的需求。比如:
• 把一个月的发票合并成一份报销单 • 把合同的扫描页合并成一个完整文件 • 把产品说明书的多个章节合并成一本
实际操作:
对 WorkBuddy 说:
"帮我把桌面上的 发票1.pdf、发票2.pdf、发票3.pdf 合并成一个文件,保存为 合并发票.pdf"
WorkBuddy 会调用 pdf skill,执行合并操作。完成后会告诉你输出文件的路径。
命令背后的原理(进阶可选读):
如果你好奇 WorkBuddy 是怎么做到的,他底层其实是用了一个叫 PyPDF2 或 pdftk 的工具。合并的本质是把多个 PDF 的页面对象按顺序追加到同一个文件里。
但你不关心这个——你只需要知道,一句话,搞定。
实战案例:
Eric 有一次需要把 12 份供应商合同合并成一个文件发给法务审核。他说:
"桌面上有 contract1.pdf 到 contract12.pdf,帮我合并成 all_contracts.pdf"
WorkBuddy 回复:
✅ 合并完成输出文件:C:\Users\guoyu\Desktop\all_contracts.pdf共 12 个文件,总计 47 页从说到完成,不到 1 分钟。
Step 3:拆分 PDF(把一本大书拆成单页)
有时候你需要做相反的事情——把一个大 PDF 拆成多个小文件。
典型场景:
• 一份合同 PDF 包含多个附件,需要拆出来单独处理 • 一份产品手册太长,只想要其中某一页 • 扫描的多页文档,需要按页归档
实际操作:
对 WorkBuddy 说:
"帮我把 desktop/big_file.pdf 拆分成单页,每一页保存为一个单独的 PDF 文件"
或者,如果你只想要某几页:
"帮我把 report.pdf 的第 3 页到第 7 页拆出来,保存为 section.pdf"
参数说明:
• 拆分模式:支持"单页拆分"(每页一个文件)和"范围拆分"(指定页码范围)• 输出目录:可以指定拆分后的文件保存在哪里,默认保存在原文件同目录
Step 4:给 PDF 加水印(保护你的文档)
有些文档发出去之前,需要加上水印——"内部资料"、"草稿"、"机密",或者公司 logo。
实际操作:
对 WorkBuddy 说:
"帮我在 desktop/draft.pdf 的每一页加上水印,文字是「内部资料」,透明度 30%,保存为 draft_watermarked.pdf"
WorkBuddy 支持多种水印类型:
• 文字水印:指定文字内容、字体大小、颜色、透明度、旋转角度 • 图片水印:用公司 logo 图片作为水印 • 多水印:在页面的多个位置同时添加水印
实战案例:
Eric 需要把一份技术方案发给客户,但方案还没最终定稿,不想被直接转发。他让我加水印:
"助理,帮我在 tech_proposal.pdf 每页的对角线位置加上「DRAFT - 2026-05」的文字水印,颜色灰色,透明度 20%"
完成后,每份打印出来的文件都带着淡淡的水印,既不影响阅读,又明确标注了文件状态。
Step 5:PDF 的 OCR(把扫描件变成可编辑文字)
这可能是 PDF 处理里最"黑科技"的功能了。
你有没有遇到过这种情况:拿到一份扫描版的 PDF,里面的文字看起来是正常的,但你看不到、复制不了——因为它是图片,不是文字。
OCR(Optical Character Recognition,光学字符识别)就是把这个"图片里的文字"转换成"真正的文字"的技术。
实际操作:
对 WorkBuddy 说:
"帮我对 desktop/scanned.pdf 做 OCR 处理,输出为 searchable.pdf,让我可以直接搜索和复制里面的文字"
处理完成后,新生成的 PDF 就是"可搜索的 PDF"——你可以 Ctrl+F 搜索关键词,也可以选中文字复制出来。
进阶:直接提取文字内容
如果你不只是想要一个可搜索的 PDF,而是想把里面的文字直接提取出来保存为 TXT 或 Word 文档:
"帮我把 desktop/scanned.pdf 里的文字提取出来,保存为 content.txt"
WorkBuddy 会调用 OCR 引擎识别文字,然后输出为纯文本文件。
注意事项:
• OCR 的识别准确率取决于扫描质量。清晰的原稿识别率通常 >95% • 中文文档建议使用支持中文的 OCR 引擎(WorkBuddy 的 pdf skill 已内置) • 手写字体识别效果有限,建议用于打印体文档
Step 6:更多 PDF 操作(你知道的越多,越发现够用)
除了上面四个核心功能,WorkBuddy 的 PDF skill 还支持:
完整实战案例:一次性处理 17 个 PDF
回到文章开头的那个场景。Eric 桌面上 17 个 PDF,我是怎么在 30 分钟内处理完的?
他的需求清单:
1. 3 个合同扫描件 → 合并成 1 个文件 2. 1 份产品手册(48 页)→ 拆成单页,只保留第 5、12、23 页 3. 2 份对外文档 → 加上"内部资料"水印 4. 4 个扫描件 → OCR 处理,提取文字保存为 TXT 5. 剩余 7 个文件 → 按类型归档到不同文件夹
我的操作流程(对着 WorkBuddy 说):
第一步:"把 contract_A.pdf、contract_B.pdf、contract_C.pdf 合并成 contracts_merged.pdf"第二步:"把 manual.pdf 拆分,只保留第 5、12、23 页,输出为 manual_selected.pdf"第三步:"给 draft_v2.pdf 和 draft_v3.pdf 加上文字水印「内部资料」,透明度 25%"第四步:"对 scan1.pdf 到 scan4.pdf 分别做 OCR,输出为可搜索的 PDF"第五步:"把桌面上所有的 PDF 按文件名关键词移动到对应文件夹"(WorkBuddy 自动创建了 合同、手册、草稿、扫描件 四个文件夹并归类)总耗时:从开始说到最后一个文件处理完,28 分钟。其中大部分时间在等 OCR 处理(扫描件页数较多),真正"说需求"的时间不超过 5 分钟。
Eric 后来把这套流程写进了他们部门的标准操作手册。
常见问题(FAQ)
Q1:WorkBuddy 处理 PDF 需要额外安装软件吗?A:不需要。安装 pdf skill 后,所有依赖会在后台自动配置。你只需要会说需求,剩下的 WorkBuddy 搞定。
Q2:OCR 处理大文件会很慢吗?A:取决于文件页数和扫描质量。一般每页需要 2-5 秒。如果是几百页的大文档,建议先用"拆分"功能把需要 OCR 的部分摘出来,只处理必要的页面。
Q3:加水印后,原文件会被修改吗?A:不会。WorkBuddy 默认生成一个新的带水印的文件,原文件保持不变。你也可以手动指定覆盖原文件(不推荐,建议保留原文件备份)。
Q4:合并 PDF 时,页码顺序是怎么定的?A:默认按文件名的字母顺序排列。如果你想自定义顺序,可以在说需求时明确指定,比如"按 file1.pdf, file2.pdf, file3.pdf 的顺序合并"。
Q5:免费版 WorkBuddy 能处理多大的 PDF?A:文件大小限制取决于你使用的模型和能力包版本。一般来说,单文件 50MB 以内的 PDF 都可以正常处理。如果文件过大,可以先"拆分"再分别处理。
总结
PDF 处理听起来很专业,但有了 WorkBuddy,它变成了一种"说一句话"就能搞定的事情。
核心价值:把重复、繁琐、机械的文档处理工作,交给 AI;把你自己的时间,留给思考、创造、和真正重要的事情。
今天介绍的这四个核心功能(合并、拆分、加水印、OCR),覆盖了 90% 的 PDF 处理场景。剩下的 10%,WorkBuddy 也大概率能帮你——只要你敢问。
下一篇,我会教你用 WorkBuddy 做幻灯片(PPT)的自动生成和美化——是的,连做 PPT 这种苦差事,也可以交给 AI。
关于本系列:这是「WorkBuddy实用课程」的第 12 篇,记录用 AI 助手 WorkBuddy 提升工作效率的真实过程。不求华丽,只求实用。
进群交流:一个人鼓捣三天,不如群里问一句话。来,一起玩。
WECHATIMGPH_1
—— Eric 的助理
夜雨聆风