把一堆 PDF、Word 变成一份报告:国内模型也能干

前面三篇你已经会安装Claude code、也学会了如何有效跟Claude Code对话了。今天我们开始让Claude Code执行一些对话以外的工作。

第一个场景，让我们选择了最多人有共鸣的——资料整理。

你电脑里是不是有一些想看却一直没时间看的资料，比如：

一堆行业报告 PDF
会议纪要、合同 Word、Excel 报表
几十篇参考文献

现在有了Claude Code，你可以把这些资料喂给 Claude Code，让它替你读、替你提炼。

以下教程重点照顾用 DeepSeek、智谱 GLM 等国产模型的你。因为这里有个大坑，不讲清楚你会一头雾水。

一、先说个反直觉的真相

你可能以为：把 PDF 拖进去，AI 直接"看"一眼就读懂了。

用 Claude 原版模型确实可以。但用国产模型（DeepSeek / 智谱 GLM），不行。

为什么？因为国产模型接入 Claude Code 走的是"Anthropic 兼容接口"，而这个接口——

DeepSeek 官方明确写了：不支持图片、不支持 PDF 文档
[^1]
智谱 GLM-4.6（最常用的那个）是纯文本模型
，也吃不了 PDF[^2]

那国产模型用户就没法整理资料了吗？ 当然不是。有个万能解法，而且更稳。当然，并不是说一定需要走以下步骤，我在最新版本的Claude Code里已经试过，不用安装，它已经聪明到自己写脚本或者自动去下载三方工具来对PDF提取内容了。以下步骤供大家参考。

二、万能第一步：把资料变成"纯文本"

所有 AI 模型——不管 Claude 还是 DeepSeek、GLM——读纯文字都没问题。问题只出在"直接看 PDF/Word 这种特殊格式"上。

所以思路很简单：先把 PDF、Word、Excel 统统转成纯文本（Markdown），再交给 AI。 转换是在你电脑本地做的，完全不需要模型有什么多模态能力，DeepSeek、GLM 都照样顺畅。

转换神器叫 markitdown（微软开源的免费工具）[^4]，专门干这个。

好消息是——你不用自己学怎么用它，让 Claude Code 替你装、替你转。

进到你的资料文件夹，启动 claude，直接说：

这⁠个⁠文⁠件⁠夹⁠里⁠有⁠一⁠堆 PDF 和 Word 文⁠件⁠。请⁠先⁠帮⁠我⁠装⁠好 markitdown 工⁠具⁠，⁠然⁠后⁠把⁠所⁠有⁠这⁠些⁠文⁠件⁠转⁠成 Markdown 纯⁠文⁠本⁠，转⁠好⁠的⁠文⁠本⁠放⁠到⁠一⁠个 converted 子⁠文⁠件⁠夹⁠里⁠。

它会自己跑 pip install 'markitdown[all]'（[all] 很关键，带上才能转 PDF/Word/Excel 全套格式），再一个个转换。转完，converted 文件夹里就是一堆 AI 能轻松读的 .md 文件了。

如果它转某个格式时报"缺依赖"，提醒它"用 pip install 'markitdown[all]' 装全套"即可。

💡 markitdown 能转：PDF（文字版）、Word、Excel、PPT、HTML、CSV——常见办公格式基本全包[^4]。

三、第二步：让它综合成报告

文本就位，开始派活。直接说人话：

读 converted 文⁠件⁠夹⁠里⁠所⁠有⁠的 .⁠md 文⁠件⁠，⁠帮⁠我⁠：1⁠. 提⁠炼⁠每⁠份⁠的⁠核⁠心⁠观⁠点2⁠. 找⁠出⁠它⁠们⁠的⁠共⁠识⁠和⁠分⁠歧3⁠. 汇⁠总⁠成⁠一⁠份⁠报⁠告⁠，⁠存⁠成 报⁠告⁠.⁠md

这一步读的是纯文本，DeepSeek、GLM 完全胜任。

你出去倒杯水的工夫，报告.md 就静静躺在文件夹里了。

💡 关键心法：任务越具体，结果越好。"总结一下"太空泛；“提炼核心观点 + 找共识分歧 + 存成报告”——它就知道该交付什么。

🎁 偷懒版：其实你也可以把第二、第三步合成一句话——“把这个文件夹里的 PDF 和 Word 整理成一份综合报告”——它会自己想到"要先转文本再读"。但分步说更可控，新手建议先分步。

四、先让它列清单，你再决定

如果资料很多、很杂，别一上来就让它全做完。先让它列个清单给你看（转成文本之后）：

converted 文⁠件⁠夹⁠里⁠每⁠个⁠文⁠件⁠大⁠概⁠讲⁠什⁠么⁠？⁠用⁠一⁠句⁠话⁠告⁠诉⁠我⁠。

它会给你一张"资料地图"：

1⁠. 2025⁠行⁠业⁠白⁠皮⁠书⁠.⁠md —— 讲⁠市⁠场⁠规⁠模⁠和⁠增⁠长⁠预⁠测2⁠. 竞⁠品⁠分⁠析⁠.⁠md —— 对⁠比⁠了 5 家⁠主⁠要⁠厂⁠商3⁠. 会⁠议⁠纪⁠要⁠0512⁠.⁠md —— 上⁠次⁠战⁠略⁠会⁠的⁠决⁠议.⁠.⁠.

看完这张图，你再挑重点：

重⁠点⁠把⁠第 1、2 份⁠的⁠数⁠据⁠提⁠炼⁠出⁠来⁠，⁠做⁠成⁠一⁠张⁠对⁠比⁠表⁠。

这种"先勘探、再下手"的方式，比一股脑全扔给它更可控。

五、几个让结果更靠谱的小技巧

1. 让它标出处。 加一句"每个结论后面注明来自哪份文件"，方便你回头核对。

2. 扫描版 PDF 要特殊处理。 如果你的 PDF 是拍照/扫描的图片（不是文字版），markitdown 转不出文字——这种得先用 OCR 工具（文字识别）转成文字。纯文字版 PDF 没这问题。

3. 一定要核对关键数据。 AI 提炼大体可靠，但涉及金额、日期、关键数字，自己回原文件核一遍。它是帮你省时间的助手，不是甩手不管的理由。

4. 让它存成文件。 加一句"存成 xxx.md"，结果就落地成文件，不会聊完就没。

六、隐私：我的资料会被上传吗？

很多人最担心这个——“我把合同、报告喂进去，会不会泄露？”

说清楚：

转文本（markitdown）是在你电脑本地做的
，这一步不联网、不上传。
但 AI 理解内容时，相关文字会发给模型处理（这是所有 AI 工具的共性）。

所以：

一般工作资料、公开报告、学习材料 → 放心用
高度敏感
的（身份证、银行流水、未公开核心机密）→ 自己掂量

想最稳妥？用本地模型，数据完全不离开你的电脑。退一步，用 DeepSeek/GLM 等国产后端，数据至少不发往国外。

七、练手任务

找一个你真实存着没空看的资料堆，今天就处理掉：

建个文件夹，把 PDF / Word 拖进去
cd 进去，claude 启动
让它"装 markitdown → 把文件转成 Markdown → 综合成报告"
回原文件核对关键数据

做完你会有种"积压清空"的爽感。

写在最后

资料整理是 Claude Code 最容易出效果的场景——因为读和提炼正是 AI 的强项，而这恰恰是最耗你时间的体力活。

国产模型用户记住这条万能路线：

先转纯文本（markitdown），再让 AI 整理。

绕开了"国产模型读不了 PDF/Word"的坑，DeepSeek、GLM 都能顺畅干活。

下一篇 [[C05-写作伙伴]]，换个场景——教你和它一起，从一句话大纲写出一篇完整文章。

[^1]: 来源：DeepSeek Anthropic 兼容 API 官方文档 https://api-docs.deepseek.com/guides/anthropic_api （Message Fields 兼容表明确标注 image、document 类型 “Not Supported”） [^2]: 来源：智谱 GLM 模型文档 https://docs.bigmodel.cn/ ——接入 Claude Code 常用的 GLM-4.6 为文本模型；视觉能力在独立的 GLM-4.6V 系列。 [^3]: 来源：Claude Code 源码 src/utils/pdfUtils.ts（isPDFSupported() 仅按模型名是否含 claude-3-haiku 判定，对国产模型一律放行，无法感知后端真实能力） [^4]: 来源：microsoft/markitdown https://github.com/microsoft/markitdown （MIT 开源，支持 PDF/Word/Excel/PPT/HTML/CSV 转 Markdown）