你是不是也这样:一堆合同、课件、报告、发票扫描件,明明都叫 PDF,丢给 AI 以后却总觉得哪里不对。表格断行、页码错位、扫描件没 OCR,最后不是省时间,是多了一轮返工。
先别怪自己不会问。PDF 本来就不是一种“干净文本”,它更像一个盒子:里面可能是文字、图片、表格、表单、印章、扫描页混在一起。今天这张卡,只讲一个能马上用的 Top 热门 Agent Skill:`anthropics/skills@pdf`。

它的价值不是“帮你看 PDF”这么空,而是把 PDF 常见任务拆成几条清楚的路:抽文字用 `pdfplumber`,拆合并用 `pypdf` / `qpdf`,扫描件先 OCR,表格单独抽,表单另看表单逻辑。

安装就一句:
```bash
npx skills add anthropics/skills@pdf
```
源码路径也记一下:`https://github.com/anthropics/skills/tree/main/skills/pdf`。想看介绍页,可以搜 `skills.sh/anthropics/skills/pdf`。今天拉到的热度信号是:Skills 搜索里 `pdf` 结果第一位,显示 92K installs;所在仓库 GitHub API 当前显示 127,707 stars。

真正用的时候,不要只说“帮我总结这个 PDF”。换成这三句会稳很多:
- `先告诉我它是文字 PDF 还是扫描 PDF。`
- `把表格抽成 CSV,并标出来自第几页。`
- `只拆第 3-5 页,另存一个新 PDF。`
这就是它比普通提示词更值的地方:你不是让 AI 猜工具,而是让它按 PDF 任务类型选路。

但有一条要放心里:它能帮你处理文件,不代表它能替你判断文件。合同、病历、身份证、银行卡、公司报价单,先脱敏再传;扫描件太糊、表格跨页、印章遮字,一定要人眼复核。
最适合它的场景,是你每天都在重复这些小崩溃:把 8 个 PDF 合成一个、把 50 页拆成 3 份、从年报里抽表、给扫描件 OCR、把表单字段读出来。先让 `pdf` 把脏活理顺,你再做判断。

今天的结论就一句:PDF 交给 AI 之前,先问它“这份 PDF 到底是哪种 PDF”。 这一步做对,后面少很多自我怀疑。
夜雨聆风