让 Claude Code 帮你处理 PDF?这个 Skill 让它秒变 PDF 专家
大家好,我是阿成。
做开发的朋友都知道,最烦的不是写业务逻辑,而是:
-
客户发来一堆 PDF 要提取数据 -
需要批量合并/拆分 PDF 文件 -
PDF 表单要自动填写,手动填到崩溃 -
扫描件要 OCR 识别,还得保持格式
每次处理 PDF 都要查一堆库的文档,效率太低了。
最近发现一个官方 Skill 叫 pdf,装上之后 Claude Code 就像请了个专职 PDF 工程师——从文本提取到表单填写,从合并拆分到 OCR 识别,全方位搞定你的 PDF 需求。
先装上
mkdir -p ~/.claude/skillscd ~/.claude/skillsgit clone --depth 1 https://github.com/anthropics/skills.git temp-skillscp -r temp-skills/skills/pdf .rm -rf temp-skills
装完重启 Claude Code 就能用了。
它解决什么问题?
一句话:让 Claude 像专业 PDF 工程师一样帮你处理各种 PDF 任务。
核心理念:工具选型 + 代码生成 + 自动化流程。
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
核心能力
1. 文本和表格提取
你只需要说:
帮我提取这个 PDF 里的所有表格
Claude 会自动选择最佳工具(pdfplumber)并生成代码:
import pdfplumberimport pandas as pdwith pdfplumber.open("document.pdf") as pdf: all_tables = []for page in pdf.pages: tables = page.extract_tables()for table in tables:if table: df = pd.DataFrame(table[1:], columns=table[0]) all_tables.append(df)# 导出到 Excelif all_tables: combined_df = pd.concat(all_tables, ignore_index=True) combined_df.to_excel("extracted_tables.xlsx", index=False)
2. PDF 合并与拆分
把这 10 个 PDF 合并成一个
或者:
把这个 100 页的 PDF 按每 10 页拆分
Claude 会用 pypdf 或 qpdf 帮你搞定。
3. 表单自动填写(重点功能)
这是这个 Skill 最强大的地方。
场景:你有一个 PDF 表单,需要批量填写。
传统方式:手动打开 → 一个个填 → 保存 → 重复 100 次
用这个 Skill:
帮我填写这个 PDF 表单,姓名填张三,日期填今天
Claude 会:
-
检测表单类型:判断是可填写表单还是扫描件 -
提取字段信息:自动识别所有表单字段 -
生成填写方案:创建 JSON 配置文件 -
执行填写:调用脚本完成填写
对于可填写表单:
# 检查表单字段python scripts/check_fillable_fields.py form.pdf# 提取字段信息python scripts/extract_form_field_info.py form.pdf field_info.json# 填写表单python scripts/fill_fillable_fields.py form.pdf field_values.json output.pdf
对于扫描件(非可填写表单):
-
转换为图片分析 -
识别填写区域的边界框 -
生成验证图片确认位置 -
用注释方式添加文字
4. OCR 识别
这个扫描件帮我识别成文字
Claude 会用 pytesseract + pdf2image:
import pytesseractfrom pdf2image import convert_from_pathimages = convert_from_path('scanned.pdf')text = ""for i, image in enumerate(images): text += f"Page {i+1}:\n" text += pytesseract.image_to_string(image) text += "\n\n"
工具选型指南
这个 Skill 内置了完整的工具选型知识:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
触发方式
这个 Skill 会在以下场景自动触发:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
不需要记复杂的库名和 API,自然说话就行。
对比传统方式
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
重点:省下的时间可以用来做更有价值的事。
适合谁用?
后端开发者:
-
需要处理用户上传的 PDF -
批量生成 PDF 报告 -
自动化文档处理流程
数据分析师:
-
从 PDF 报表提取数据 -
批量处理财务报表 -
表格数据导出到 Excel
运营人员:
-
批量填写合同/表单 -
合并拆分文档 -
文档格式转换
进阶用法
批量处理
把 /documents 目录下所有 PDF 的第一页提取出来合并
复杂表单
这个 W-9 表单,帮我填写公司信息,需要签名的地方标注出来
数据提取 + 分析
提取这份财报 PDF 里的所有表格,分析营收趋势
加密解密
给这个 PDF 加上密码保护,只允许打印不允许编辑
核心价值
这个 Skill 的价值在于:
自动选型 > 自己查资料代码生成 > 从零开始写流程自动化 > 手动重复操作
PDF 处理不是难事,难的是知道用什么工具、怎么用。
一句话总结
这个 Skill 的价值不是替你处理 PDF,而是帮你选对工具、生成代码、自动化流程——从文本提取到表单填写,从合并拆分到 OCR 识别,一句话搞定,不用再查文档。
好了,今天就聊到这。有问题评论区见!
项目地址:https://github.com/anthropics/skills
夜雨聆风
