乐于分享
好东西不私藏

让 Claude Code 帮你处理 PDF?这个 Skill 让它秒变 PDF 专家

让 Claude Code 帮你处理 PDF?这个 Skill 让它秒变 PDF 专家

大家好,我是阿成。

做开发的朋友都知道,最烦的不是写业务逻辑,而是:

  • 客户发来一堆 PDF 要提取数据
  • 需要批量合并/拆分 PDF 文件
  • PDF 表单要自动填写,手动填到崩溃
  • 扫描件要 OCR 识别,还得保持格式

每次处理 PDF 都要查一堆库的文档,效率太低了。

最近发现一个官方 Skill 叫 pdf,装上之后 Claude Code 就像请了个专职 PDF 工程师——从文本提取到表单填写,从合并拆分到 OCR 识别,全方位搞定你的 PDF 需求。

先装上

mkdir -p ~/.claude/skillscd ~/.claude/skillsgit clone --depth 1 https://github.com/anthropics/skills.git temp-skillscp -r temp-skills/skills/pdf .rm -rf temp-skills

装完重启 Claude Code 就能用了。

它解决什么问题?

一句话:让 Claude 像专业 PDF 工程师一样帮你处理各种 PDF 任务

核心理念:工具选型 + 代码生成 + 自动化流程

传统方式
用这个 Skill
不知道用哪个库
自动选择最佳工具
查文档写代码
直接生成可用代码
表单填写靠手动
自动识别字段并填写
OCR 配置复杂
一句话搞定识别

核心能力

1. 文本和表格提取

你只需要说:

帮我提取这个 PDF 里的所有表格

Claude 会自动选择最佳工具(pdfplumber)并生成代码:

import pdfplumberimport pandas as pdwith pdfplumber.open("document.pdf"as pdf:    all_tables = []for page in pdf.pages:        tables = page.extract_tables()for table in tables:if table:                df = pd.DataFrame(table[1:], columns=table[0])                all_tables.append(df)# 导出到 Excelif all_tables:    combined_df = pd.concat(all_tables, ignore_index=True)    combined_df.to_excel("extracted_tables.xlsx", index=False)

2. PDF 合并与拆分

把这 10 个 PDF 合并成一个

或者:

把这个 100 页的 PDF 按每 10 页拆分

Claude 会用 pypdf 或 qpdf 帮你搞定。

3. 表单自动填写(重点功能)

这是这个 Skill 最强大的地方。

场景:你有一个 PDF 表单,需要批量填写。

传统方式:手动打开 → 一个个填 → 保存 → 重复 100 次

用这个 Skill

帮我填写这个 PDF 表单,姓名填张三,日期填今天

Claude 会:

  1. 检测表单类型:判断是可填写表单还是扫描件
  2. 提取字段信息:自动识别所有表单字段
  3. 生成填写方案:创建 JSON 配置文件
  4. 执行填写:调用脚本完成填写

对于可填写表单:

# 检查表单字段python scripts/check_fillable_fields.py form.pdf# 提取字段信息python scripts/extract_form_field_info.py form.pdf field_info.json# 填写表单python scripts/fill_fillable_fields.py form.pdf field_values.json output.pdf

对于扫描件(非可填写表单):

  • 转换为图片分析
  • 识别填写区域的边界框
  • 生成验证图片确认位置
  • 用注释方式添加文字

4. OCR 识别

这个扫描件帮我识别成文字

Claude 会用 pytesseract + pdf2image:

import pytesseractfrom pdf2image import convert_from_pathimages = convert_from_path('scanned.pdf')text = ""for i, image in enumerate(images):    text += f"Page {i+1}:\n"    text += pytesseract.image_to_string(image)    text += "\n\n"

工具选型指南

这个 Skill 内置了完整的工具选型知识:

任务
最佳工具
备注
合并/拆分 PDF
pypdf
Python 原生,简单高效
提取文本
pdfplumber
保持布局,支持表格
提取表格
pdfplumber
自动识别表格结构
创建 PDF
reportlab
功能强大,支持复杂排版
命令行操作
qpdf
速度快,功能全
OCR 识别
pytesseract
开源免费,效果好
表单填写
pdf-lib (JS) / pypdf
保持表单结构

触发方式

这个 Skill 会在以下场景自动触发:

你说的话
Claude 的反应
“帮我提取 PDF 里的文字”
选择 pdfplumber 提取
“把这些 PDF 合并”
用 pypdf 合并
“填写这个 PDF 表单”
启动表单填写流程
“这个扫描件识别一下”
用 OCR 识别
“生成一个 PDF 报告”
用 reportlab 创建

不需要记复杂的库名和 API,自然说话就行。

对比传统方式

指标
传统方式
用 pdf skill
工具选型
自己查资料对比
自动推荐最佳方案
代码编写
查文档写代码
直接生成可用代码
表单填写
手动或复杂脚本
自动化流程
学习成本
每个库都要学
说人话就行

重点:省下的时间可以用来做更有价值的事。

适合谁用?

后端开发者

  • 需要处理用户上传的 PDF
  • 批量生成 PDF 报告
  • 自动化文档处理流程

数据分析师

  • 从 PDF 报表提取数据
  • 批量处理财务报表
  • 表格数据导出到 Excel

运营人员

  • 批量填写合同/表单
  • 合并拆分文档
  • 文档格式转换

进阶用法

批量处理

把 /documents 目录下所有 PDF 的第一页提取出来合并

复杂表单

这个 W-9 表单,帮我填写公司信息,需要签名的地方标注出来

数据提取 + 分析

提取这份财报 PDF 里的所有表格,分析营收趋势

加密解密

给这个 PDF 加上密码保护,只允许打印不允许编辑

核心价值

这个 Skill 的价值在于:

自动选型 > 自己查资料代码生成 > 从零开始写流程自动化 > 手动重复操作

PDF 处理不是难事,难的是知道用什么工具、怎么用。

一句话总结

这个 Skill 的价值不是替你处理 PDF,而是帮你选对工具、生成代码、自动化流程——从文本提取到表单填写,从合并拆分到 OCR 识别,一句话搞定,不用再查文档。


好了,今天就聊到这。有问题评论区见!

项目地址:https://github.com/anthropics/skills

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 让 Claude Code 帮你处理 PDF?这个 Skill 让它秒变 PDF 专家

评论 抢沙发

8 + 1 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮