1 概述
Document Skills 是 Anthropic 官方发布的核心技能套件,包含四个办公文档处理技能:
├── pdf → PDF 全能处理(提取/合并/OCR/表单)
├── xlsx → Excel 创建与分析(公式/图表/财务建模)
├── docx → Word 创建与编辑(修订/批注/排版)
└── pptx → PPT 创建与编辑(HTML渲染/模板/验证)
PDF Skill:
主要功能包括:读取或提取PDF中的文本/表格、合并多个PDF为一个、拆分PDF、旋转页面、添加水印、创建新PDF、填写PDF表单、加密/解密PDF、提取图片,以及对扫描版PDF进行OCR识别以实现可搜索。
2․ XLSX Skill:
主要功能包括:打开、读取、编辑或修复现有的 .xlsx、.xlsm、.csv 或 .tsv 文件(如添加列、计算公式、格式化、制图、清理杂乱数据);从零开始或从其他数据源创建新电子表格;或在表格文件格式之间进行转换。
3․ DOCX Skill:
主要功能包括:创建、读取、编辑或操作 Word 文档(.docx 文件);生成带有目录、标题、页码、信头等格式的专业文档;从 .docx 文件中提取或重组内容、在文档中插入或替换图片、在 Word 文件中执行查找替换、处理修订或批注,或将内容转换为精美的 Word 文档。
4․ PPTX Skill:
主要功能包括:创建幻灯片组、融资演示文稿或演示文稿;读取、解析或从任何 .pptx 文件中提取文本(即使提取的内容将用于其他地方,如邮件或摘要);编辑、修改或更新现有演示文稿;合并或拆分幻灯片文件;处理模板、版式、演讲者备注或批注。
2 安装
在Claude Code 对话框中输入:


3 使用
- PDF 场景
# 从合同中提取关键条款
"帮我从这份合同PDF中提取:甲方、乙方、合同金额、付款条件、违约责任,整理成表格"
# 从发票中批量提取数据
"这个文件夹有50张发票PDF,帮我逐一提取:发票号、日期、金额、抬头,汇总到一个Excel里"
# 从论文中提取图表数据
"把这篇论文PDF里的所有表格提取出来,保存为CSV"
# === 合并 & 拆分 ===
# 合并多个PDF
"把这三个PDF合并成一个文件,按文件名排序"
# 拆分为单页
"把这个PDF拆成每页一个独立文件"
# === 创建 PDF ===
# 从零生成报告PDF
"帮我把这份数据分析结论生成一份正式PDF报告,含封面、目录、图表"
# Markdown 转 PDF
"把这篇 Markdown 文章转成排版精美的 PDF,用 A4 纸张"
# === 编辑 ===
# 添加水印
"给这批PDF每页加上'机密'水印,半透明居中"
# 加密
"给这份PDF加密码保护,密码是123456"
# 表单填写
"填写这份报名表PDF:张三, 男, 1990-01-01, 13800138000"
# === OCR ===
# 扫描件文字识别
"这份扫描件PDF的文字不清晰,帮我做OCR识别,提取全部文字"
2․XLSX 场景
# 基础分析
"分析这份销售数据:按月汇总、同比增长、Top 10 客户,生成分析报表"
# 复杂查询
"在这些数据中找出:退货率超过10%的产品、连续3个月下滑的品类"
# 数据清洗
"这份CSV的日期格式不一致、有空值、有重复行,帮我清洗后保存"
# === 创建报表 ===
# 预算跟踪表
"帮我创建一份2026年部门预算跟踪表,包含:
- 12个月的分项预算列
- 实际支出 vs 预算的对比公式
- 自动计算偏差百分比
- 超出10%标红,低于5%标绿
- 按月汇总和全年累计"
# 项目进度表
"创建项目进度跟踪表:任务名/负责人/开始日期/截止日期/完成百分比/状态
用条件格式:逾期变红、本周截止变黄、已完成变绿"
# === 财务建模 ===
# DCF 估值
"构建一个 DCF 估值模型:5年自由现金流预测 + 终值计算 + WACC折现"
# 损益表
"根据这份收支数据,生成带公式的损益表:收入/成本/毛利/费用/净利,自动计算利润率"
# === 图表 ===
# 趋势图
"在这份数据中插入月度收入趋势柱状图,加趋势线"
# 饼图
"按产品类别生成市场份额饼图,标注百分比"
3․DOCX 场景
# 会议纪要
"帮我写一份项目周会纪要,模板包含:
- 会议基本信息(时间/地点/参会人)
- 上周任务完成情况表格
- 本周议题讨论记录
- 决议事项(责任人+截止日期)
- 下周计划"
# 技术方案
"写一份XX系统的技术方案文档,含:
- 需求概述
- 技术选型对比表
- 系统架构图(用文字描述)
- 接口定义
- 部署方案"
# === 格式转换 ===
# Markdown → Word
"把这篇Markdown笔记转成Word文档,保留标题层级、代码块、表格样式"
# === 编辑 & 审阅 ===
# 追踪修订(Redlining)
"审阅这份合同,用追踪修订功能修改以下内容:
- 付款条件从30天改为60天
- 违约金从5%改为3%
- 删除第8条免责条款"
# 样式统一
"统一这份文档的格式:正文宋体小四、标题黑体、行距1.5倍、首行缩进2字符"
# === 模板批量生成 ===
# 批量合同
"我有一份合同模板和100个客户信息Excel,帮我对每个客户生成一份填好的合同"
4․PPTX 场景
# 汇报PPT
"帮我做一份Q2产品汇报PPT(10页以内):
- 封面:标题+副标题+日期
- 第2页:目录
- 第3-4页:Q2核心数据亮点(用图表占位)
- 第5-6页:重点项目进展
- 第7页:问题与风险
- 第8-9页:Q3规划
- 第10页:致谢
配色用深蓝色系,简洁商务风格"
# 路演PPT
"做一份创业项目路演PPT:
- 痛点分析 → 解决方案 → 市场规模 → 产品演示占位
- 商业模式 → 竞品对比表 → 团队介绍 → 融资计划
用橙黑配色,每页不超过5个要点"
# === 基于模板 ===
# 套用公司模板
"我有公司的PPT模板.pptx,帮我按照模板样式生成Q3汇报内容"
# → 会自动调用 inventory → 分析模板布局 → 填入内容 → 保留格式
# === 编辑 ===
# 修改已有PPT
"把这份PPT的第5页图表数据更新为最新数据,第8页删除,增加一页竞品分析"
# 添加演讲者备注
"给这份PPT每一页添加演讲者备注,包含这一页的讲解要点"
# === 格式转换 ===
# PPT → PDF
"把这份PPT导出为PDF,加密码保护"
# PPT → 图片
"把PPT每一页导出为PNG图片,用于手机预览"
5․链式工作流
多个 Skills 串联,一句话完成端到端任务:
"分析这份Q3销售数据:
1. 用 xlsx 做数据清洗和KPI计算,生成带图表的财务模型
2. 把关键图表嵌入 PPT,生成8页高管汇报幻灯片
3. 最后导出为加密PDF用于分发"
# === PDF → Excel → Word ===
"这个文件夹有30份供应商合同PDF:
1. 批量提取每家供应商的名称、产品、单价、账期
2. 汇总到 Excel,按账期排序,标注即将到期的
3. 生成一份供应商分析 Word 报告,附上数据表"
# === 会议全流程 ===
"根据这份会议录音转写的文本:
1. 用 xlsx 提取待办事项表(责任人+截止日期)
2. 用 docx 生成正式会议纪要
3. 用 pptx 生成下次汇报的框架页"
4 文档格式转换
- PDF 格式转换:
⚠️ 重要:这些转换是「内容提取 + 重新生成」,不是「格式无损克隆」。文字的原始排版(精确位置、分栏、字体)不会 100% 还原,但内容和表格结构会完整保留。
- PDF → Excel :
这是四个转换方向中最强的能力,底层使用 pdfplumber 精确提取表格:
"把这份PDF里的所有表格提取出来,存到一个Excel里,每个表格一个Sheet"
# 批量提取
"这个文件夹有30份发票PDF,帮我逐一提取发票号、日期、金额、抬头,
汇总到一个Excel,按日期排序"
# 带分析的提取
"从这份财报PDF中提取三年的利润表数据,在Excel里计算同比增长率,
做成带趋势图的财务分析表"
- PDF → Word:
通过提取内容,重新生成结构化 Word 文档:
"把这份PDF转成Word文档,保留标题层级和段落结构"
# 带格式增强
"把这份PDF合同的内容提取出来,按以下结构整理成Word:
- 封面页(合同名称+双方信息)
- 正文(保留条款编号)
- 签名页
用正式商务模板的样式"
# 批量转换
"把这10份PDF转成Word,统一加上公司页眉页脚和页码"
- PDF → PPT:
不是直接转换,而是提取 PDF 中的内容精华,重新编排为 PPT:
"把这份PDF研究报告的核心内容提炼成8页汇报PPT:
- 封面 → 研究背景 → 关键发现 → 数据亮点 → 结论建议"
# 论文转答辩PPT
"把这篇论文PDF做成15分钟答辩用PPT,突出重点和图表"
推荐做法是描述你想要的 PPT 结构,而不是指望像素级复刻 PDF 的布局。
- PDF → 图片:
原生支持,最直接:
"把这份PDF每一页导出为高清PNG图片"
# 指定页
"把PDF的第3-8页导出为JPG,质量90%"
# 生成缩略图
"把这PDF所有页面生成缩略图网格,方便预览"
# OCR场景
"这份PDF是扫描件,先转成图片做OCR识别,再提取文字"
2․跨格式链式转换:
Document Skills 的真正威力在于串联:
"我有三份PDF财报,帮我:
1. 提取所有财务表格 → 汇总到一个Excel
2. 在Excel中计算同比环比、生成趋势图表
3. 根据分析结果生成8页PPT汇报
4. 最后导出加密PDF分发给高管"
# === 扫描件 → Word → PDF ===
"这份扫描件PDF先做OCR → 提取全文 → 整理成排版规范的Word → 导出为干净PDF"
3․局限和注意:
一句话总结:所有方向都能转,但本质是「读懂内容 → 重新写出来」而不是「另存为」。表格数据最擅长(PDF → Excel),纯文本其次(PDF → Word/Markdown),图片渲染原生支持,PPT 需要你描述想要的页面结构。
5 使用技巧 & 注意事项
✅ 提效技巧
⚠️ 注意事项
夜雨聆风