大家好,我是王小二,今天给大家分享如何使用pdf技能丝滑处理PDF。
房东发来租房合同 PDF,你想把押金条款复制出来;报销要把行程单、发票、酒店单子合成一份;写好的 Word 方案要转成 PDF 发客户——预览器里复制粘贴费劲,网上转换又怕文件泄露。
pdf 是什么
你在 Cursor、Claude Code 或 Codex 里跟 AI 聊天,它本来就能帮你想文案、改稿子。但一碰到 PDF,经常只会说「你去下个软件」——合并、拆页、从文件里抠表格,还得你自己摸索。
pdf 是 Anthropic 官方出的一个 Skill(插件):装好之后,AI 就知道怎么处理 PDF 了。你不用学编程,也不用记命令,像吩咐同事一样说清楚就行。
装完你能干什么:
• 读 PDF:把里面的字、表格抄出来,不用一页页选中复制 • 改 PDF:几份合成一份、只要其中几页另存、把横着的页转正 • 做 PDF:从零生成一份带标题、段落的 PDF(比如简单报告) • 救扫描件:手机拍出来、全是图片的 PDF,让 AI 把图里的字认出来,以后能搜索、能复制 • 填表:入职表、报名表,告诉 AI 姓名电话,它帮你填进 PDF 里
打个比方:没装之前,AI 像个只会说「你去打印店」的客服;装了 pdf 之后,旁边多了个会处理文档的助理——你说「把这三份合成一份」「把 Word 转成 PDF」,它自己找办法弄好,文件落在你的文件夹里。
开源地址:github.com/anthropics/skills/tree/main/skills/pdf
pdf 能解决什么问题
• PDF 只能看,不好改:合同、报价单、对账单,想抠一段文字或整张表,预览器里很难弄整齐。 • 扫描件选不中字:手机扫的 PDF 像一张照片,复制不了,搜关键词也搜不到。 • 几份材料要拼一份:报销、交材料,好几份 PDF 要按顺序合成一份,手工拖容易乱页码。 • Word 要转成 PDF 再发: .docx直接发别人,版式容易变;转成 PDF 才稳,你又不想为此专门开会员网站。• 表格填到手酸:入职表、活动报名表,一项项点鼠标填,信息多的时候很烦。
如何安装
前置条件
你需要:
1. 电脑上已经装了 Cursor、Claude Code 或 Codex 之一(不会装?可以看项目里的安装教程;下文以 Codex 为例,另两个平台把工具名换掉即可) 2. 能上网(装插件、第一次处理文件时可能要下载小工具,AI 会提示你)
下面这些不用提前装,第一次用到时 AI 会告诉你缺什么、怎么装:
| Word 转 PDF |
pdf 插件免费,不用配 API Key(账号密钥)。
安装步骤
最简单:复制这段话,让 AI 帮你装
在 Cursor / Claude Code / Codex 里粘贴(把「Codex」换成你正在用的工具名):
帮我安装 pdf skill仓库:https://github.com/anthropics/skills只装 pdf 这一个 skill,装到 Codex 全局目录AI 会自动下载、放好。你等着就行。
三平台手动安装对照(想自己敲命令再用这张表,复制粘贴即可):
npx skills add anthropics/skills --skill pdf -a cursor -g -y | -a cursor 换成 -a claude-code | npx skills add anthropics/skills --skill pdf -a codex -g -y | |
~/.cursor/skills/ | ~/.claude/skills/ | ~/.codex/skills/ | |
-g) | .agents/skills/ | .claude/skills/ | .agents/skills/ |
各参数意思:
• --skill pdf:只装这一个,不装仓库里别的• -a <平台>:装给哪个工具用• -g:装到全局,以后打开任何文件夹都能用• 去掉 -g:只装到当前项目文件夹
验证安装
看文件在不在(把路径换成你的平台):
# Codexls ~/.codex/skills/pdf/SKILL.md# Cursorls ~/.cursor/skills/pdf/SKILL.md# Claude Codels ~/.claude/skills/pdf/SKILL.md看已安装列表(-a 换成你的平台):
npx skills list -a codex | grep pdf跑一句试处理(三平台话术一样):
帮我读一下 ~/Downloads/ 里某个 PDF,告诉我有几页就行如果它开始找文件、告诉你页数,说明插件生效了。你也可以把路径说具体一点,比如 Mac 上常见是 ~/Downloads/租房合同.pdf。
如何使用
日常用法三个平台一样:直接说你要对哪个文件、想变成什么样。下文以 Codex 为例;用 Cursor 或 Claude Code 的话,把下面例子里的工具名换掉即可,话术不用改。
步骤 1:直接对话(日常就这么用)
把文件放在你找得到的地方(比如「下载」「文档」「桌面」),跟 AI 说清楚原文件在哪、要什么结果。下面这些说法都能用:
把 PDF 里的字抄出来:
帮我把 ~/Downloads/租房合同.pdf 里的正文抄出来,保存成同目录下的 合同文字.txt把 PDF 里的表格弄到 Excel:
从 ~/Documents/三月报销/发票.pdf 里把所有表格提出来,做成 Excel,文件名 发票表格.xlsx几份 PDF 合成一份:
把 ~/Documents/报销材料/ 里的 行程单.pdf、酒店.pdf、发票.pdf 按这个顺序合成一份,叫 报销汇总.pdf扫描件认字:
~/Downloads/扫描件.pdf 是手机拍的,字选不中,帮我把里面的字认出来,存成 扫描件-文字版.txt填 PDF 表格:
帮我填 ~/Downloads/入职表.pdf:姓名:张三手机:13800138000勾选「已阅读员工手册」填好的文件叫 入职表-已填.pdf你不需要记任何专业名词,说清楚文件名、放哪、要什么结果就够了。
三平台触发方式对照:
下面 5 个实战例子,你可以直接复制对话跑,把路径改成你自己的文件。
实战例子 1:Word 文档转成 PDF
最常见:你写好了一份 Word 方案(.docx),要发微信、发邮件,对方只收 PDF。
对话:
帮我把 ~/Documents/产品方案.docx 转成 PDF输出到同一个文件夹,文件名 产品方案.pdf版式尽量跟 Word 里看到的一样AI 一般会:
1. 检查你电脑有没有 LibreOffice(免费办公套件,用来在后台把 Word 转成 PDF,不会弹窗口打扰你) 2. 没有的话会提示你去下载,或问你能不能装 3. 转完后告诉你:几页、文件多大、保存在哪
你会在同文件夹里看到 产品方案.pdf,双击就能打开,直接发出去。
想一次转很多 Word:
把 ~/Documents/合同文件夹/ 里所有 .docx 都转成 PDF,PDF 放到这个文件夹里的 pdf子文件夹和网上转换站比:
实战例子 2:从合同 PDF 里抠表格
财务发来一份 PDF 对账单,你要把里面的表弄到 Excel 里算账。
对话:
从 ~/Downloads/对账单.pdf 里把所有表格提出来,合并成一个 Excel:~/Downloads/对账单表格.xlsx表特别复杂时,可以加一句:「只要第 3 页的表」或「对不齐也没关系,先导出我手动改」。
实战例子 3:报销材料合成一份
行程单、酒店水单、发票,三份 PDF 要合成一份上传。
对话:
把 ~/Documents/报销/行程单.pdf、酒店.pdf、发票.pdf 按这个顺序合成一份,保存为 ~/Documents/报销/报销汇总.pdf如果某份 PDF 有打开密码,AI 会问你密码是多少。
实战例子 4:手机扫描的 PDF 认字
同事用手机扫了一叠纸,发来 扫描件.pdf,里面全是图,复制不了字。
对话:
~/Downloads/扫描件.pdf 是扫描的,帮我把图里的字认出来,保存成 扫描件-文字.txt里面应该有中文认完后你会得到一份 .txt,可以复制、搜索。如果还想要「能搜索的 PDF」,加一句:「再生成一份能搜关键词的 PDF」。
实战例子 5:填入职表 PDF
入职表.pdf 里有姓名、日期、勾选框。
对话:
帮我填 ~/Downloads/入职表.pdf:姓名:李四入职日期:2026-06-01勾选「同意员工手册」输出 ~/Downloads/入职表-已填.pdf能直接点输入框填写的 PDF 最省事;如果是纯图片表(像扫出来的),AI 会尽量按位置填,复杂版式可能需要你最后看一眼。
步骤 2:进阶用法(可跳过)
下面给想自己多控制一点的人看。小白日常用不到,直接对话就行。
.xlsx 表格文件 | |
自己敲命令(真的很少需要):
# 从 PDF 抄文字(需先按 AI 提示装好小工具)pdftotext -layout 输入.pdf 输出.txt# 合并两份 PDFqpdf --empty --pages 甲.pdf 乙.pdf -- 合并.pdfMac 上 Word 转 PDF,AI 背后常用的是 LibreOffice,路径大概长这样(你不用自己敲,知道即可):
/Applications/LibreOffice.app/Contents/MacOS/soffice --headless --convert-to pdf --outdir ./输出文件夹 ./你的文件.docx其他平台用法(可跳过)
安装、验证、日常对话跟上文三平台对照表一致,下面只列跟 Codex 不一样的地方。
Cursor
• 项目里装插件时,路径是 .agents/skills/(不是.claude/skills/)• 对话安装时把「Codex」改成「Cursor」 • 用法完全一样:打开文件夹,粘贴上面那些例子里的话即可
Claude Code
• 项目里装插件时,路径是 .claude/skills/• 对话安装时把「Codex」改成「Claude Code」 • 其余话术、例子不用改
使用后效果
装之前: 你说「帮我把 Word 转 PDF」「把这三份合成一份」,AI 往往只给建议,或者甩一段你看不懂的东西,还得自己找网站、自己拖文件。
装之后: 说清楚文件在哪、要什么结果,AI 按插件里的套路在你电脑上处理,成品落在你的文件夹里。合同、报销单不用上传到陌生网站。
转完 Word 之后,文件夹里大概长这样:
我的文档/├── 产品方案.docx ← 原来的 Word└── 产品方案.pdf ← 新生成的 PDF,直接发送常见问题
我完全不会编程,能用吗?
能。日常就是复制文章里那些对话,改一下你的文件名和路径。不用学 Python,不用记命令。
需要学命令吗?
不用。只有想自己折腾的人才看「进阶,可跳过」那节。三平台话术一样。
不装 LibreOffice 能转 Word 吗?
转 Word 最稳的是装一个免费的 LibreOffice。没装的话,AI 会提示你去下;Mac 上如果你本来就有 Microsoft Word,也可以跟 AI 说「用 Word 另存为 PDF」试试。
扫描件认中文准吗?
跟图片清不清楚、字是不是手写有关。重要合同建议认完后自己抽查几段;跟 AI 说「里面有中文」它会尽量按中文来认。
有密码的 PDF 能处理吗?
能,但你要把打开密码告诉 AI,它才能继续合并、抄字等操作。
填表为什么有时歪了?
扫出来的表、图片表没有真正的「输入框」,AI 只能估位置填,复杂版式可能对不齐。能直接点格子填的那种 PDF 会准很多。
能不能用在别的工具?
能。Cursor、Claude Code、Codex 安装时只差对照表里的一个参数,用法一样。见「如何安装」对照表和「其他平台用法」。
要钱吗?要配 Key 吗?
插件本身免费,不用配 API Key。AI 工具本身可能有免费额度,按你用的 Cursor / Codex 等产品规则来。
总结
pdf 插件让 AI 真能帮你弄 PDF——Word 转 PDF、几份合成一份、从合同里抠表、扫描件认字、填表,都是说清楚文件在哪、要什么结果就行。装一次大概一分钟,以后文档上的杂活多一句话就能交代。
夜雨聆风