AI驱动的科研文献自动化解析工作流

🚀 一句话总结：这是一个集成了 Zotero、Python 脚本、Claude Code 和国产大模型的本地化论文分析系统，能够将 PDF 文献自动转换为 Markdown 笔记，并通过 AI 进行深度分析和可视化，极大提升科研效率。

🗺️ 阅读指南

本教程面向没有编程基础的科研新手。建议按步骤顺序操作，不要跳步。每一步末尾都附有常见错误提示，遇到问题时可以直接对照排查。

整个系统搭建完成后，你可以做到：把一篇 PDF 论文丢给 AI，8 秒后拿到结构化的 Markdown 笔记；把 20 篇论文同时交给 AI，出门喝杯咖啡，回来直接看分析报告和可视化图谱。

🏗️ 系统架构与核心组件

这个系统由六个核心组件构成，它们协同工作形成一条完整的流水线：

组件	作用	关键技术
📚 Zotero + Zutilo	文献管理、快速获取 PDF 路径	参考文献管理、插件扩展
🐍 Python 脚本	PDF 转 Markdown、调用 MinerU API	视觉大模型（VLM）、Markdown 解析
💻 Claude Code	本地 AI 代码执行环境	Node.js、命令行
🔄 CC Switch	多模型切换、API 配置管理	配置管理、模型路由
📝 Obsidian	知识管理、笔记存储	双向链接、知识图谱
🤖 Claudian 插件	Obsidian 内 AI 交互、技能调用	插件开发、技能系统

组件之间的依赖关系：

Claudian 插件运行在 Obsidian 内部，不依赖 Claude Code，两者是独立的入口
Python 脚本需要提前配置好 MinerU API Token 才能运行
CC Switch 是 Claude Code 的配置辅助工具，两者配套使用

🌐 完整工作流程

PDF 文献  ↓Zotero 管理（Zutilo 复制路径）  ↓Python 脚本调用 MinerU API 转换  ↓Markdown 笔记（存入 Obsidian）  ↓Claudian 插件调用 AI 分析  ↓Canvas 可视化图谱输出

🔧 安装与配置指南

第一步：基础环境搭建

1. 文献管理：安装 Zotero 与 Zutilo 插件

Zotero 官网：https://www.zotero.org
Zutilo 插件：https://github.com/wshanks/Zutilo

安装完成后，在 Zotero 中右键点击某篇或多篇文献的 PDF 附件，你会看到 Zutilo 新增的菜单项"复制附件路径"。这个路径就是后续 Python 脚本的输入来源。

2. 编程环境：安装 Python（推荐 Anaconda）

Anaconda 下载地址：https://www.anaconda.com/download

为什么用 Anaconda 而不是直接安装 Python？Anaconda 自带虚拟环境管理工具，可以为不同项目创建相互隔离的 Python 环境，避免不同项目之间的依赖冲突。本教程的脚本需要安装一些特定版本的库，放在独立环境里更安全。

安装完成后，打开"Anaconda Prompt"（Windows 开始菜单可以搜到），能看到命令行提示符前面有 (base) 字样，说明安装成功。

3. 笔记系统：安装 Obsidian

下载地址：https://obsidian.md/

Obsidian 本质上是一个基于本地 Markdown 文件的笔记软件，所有笔记都是普通的 .md 文件，存在你自己的电脑上。它的"双向链接"和"图谱视图"功能非常适合管理论文笔记之间的关联。

安装后，新建一个"库"（Vault），路径建议放在一个你熟悉的文件夹，比如 H:/ObsidianVaults/。后续所有 Markdown 笔记都会存入这里。

第二步：PDF 转 Markdown 脚本

获取脚本

GitHub 仓库：https://github.com/yaoqingluo/pdf2md
依赖的 API：MinerU 视觉大模型（https://mineru.net）

脚本有两个版本，两个都下载下来就行，后面根据需要选择：

版本	特点	适用场景
V1（纯文本版）	只提取文字，速度快（约 8 秒/篇）	快速获取论文内容，AI 读取效率更高
V4（全要素版）	提取文字 + 图片 + 表格 + 公式（约 14 秒/篇）	需要保留图表的完整笔记

配置步骤

第一步：申请 MinerU API Token前往 https://mineru.net 注册账号，在控制台找到"API Token"并复制。MinerU 提供一定的免费额度，日常科研使用通常够用。

第二步：配置脚本下载脚本后，用文本编辑器打开（记事本即可），找到以下两处需要修改的地方：

# 修改为你的 MinerU API TokenAPI_TOKEN ="在这里粘贴你的Token"# 修改为你的 Obsidian 笔记文件夹路径（注意：Windows 路径用正斜杠 / 或双反斜杠 \\）OUTPUT_DIR ="H:/ObsidianVaults/文献笔记/"

第三步：安装依赖库打开 Anaconda Prompt，依次运行：

conda create -n marker_env python=3.10conda activate marker_envpip install requests pathlib

⚠️ 常见错误：运行脚本时提示"ModuleNotFoundError"，说明依赖库没有安装在当前激活的环境里。检查命令行提示符前面是否显示 (marker_env)，如果不是，先运行 conda activate marker_env。

第三步：Claude Code 环境配置

Claude Code 是一个运行在命令行里的 AI 编程助手，本教程用它来执行本地脚本和 AI 交互。

1. 安装 Node.js

下载地址：https://nodejs.org/zh-cn
选择"LTS（长期支持）版本"下载安装，一路点"下一步"即可

安装完成后，打开命令提示符（Win + R，输入 cmd），运行：

node--version

如果显示版本号（如 v20.11.0），说明安装成功。

2. 安装 Git（可选但推荐）

下载地址：https://git-scm.com/
或在命令提示符中运行：winget install Git.Git

Git 是代码版本管理工具，安装后可以更方便地下载和更新 GitHub 上的项目。

3. 安装 Claude Code

在命令提示符中运行：

npminstall-g @anthropic-ai/claude-code

-g 参数表示全局安装，安装后在任意目录都可以使用 claude 命令。

4. 解决登录卡住的问题

如果启动 Claude Code 后卡在登录引导界面，用文本编辑器打开（没有则新建）以下文件：

Windows 路径：C:\Users\你的用户名\.claude.json

在文件中写入：

{"hasCompletedOnboarding":true}

保存后重新启动 Claude Code 即可跳过引导。

⚠️ 常见错误：提示"npm 不是内部或外部命令"，说明 Node.js 没有正确添加到系统 PATH。重启电脑后再试；如果还不行，重新安装 Node.js 并勾选"Add to PATH"选项。

第四步：CC Switch 配置管理

CC Switch 是一个可视化的配置工具，用来管理 Claude Code 使用的 AI 模型和 API。

GitHub 项目：https://github.com/farion1231/cc-switch

第五步：Obsidian 插件配置

安装 Claudian 插件

Claudian 是一个 Obsidian 插件，让你在笔记界面内直接调用 AI，并支持自定义"技能"（Skills）来扩展功能。

GitHub 项目：https://github.com/YishenTu/claudian

安装步骤（手动安装）：

前往 GitHub 下载最新版本的三个文件：main.js、manifest.json、styles.css
打开 Obsidian 库所在的文件夹，进入 .obsidian/plugins/ 目录
在 plugins 文件夹内新建一个名为 claudian 的子文件夹
将三个文件复制进去
在 Obsidian 设置 → 第三方插件 → 找到 Claudian，点击启用

配置 Claudian

进入 Obsidian 设置 → Claudian，填写：

API Key：你的 Silicon Flow API Key
Base URL：https://api.siliconflow.cn/v1（注意末尾有 /v1）
模型选择：Pro/zai-org/GLM-4.7 或其他你在 Silicon Flow 上可用的模型

安装 Skills（可选但强烈推荐）

Skills 是可以让 Claudian 调用的预定义操作集合，相当于给 AI 配备工具箱。

Obsidian 官方 Skills：https://github.com/kepano/obsidian-skills
可视化 Skills（生成 Canvas 图）：https://github.com/axtonliu/axton-obsidian-visual-skills

下载后，将 skills 文件放入你的 Obsidian 库的 .claude/skills/ 文件夹中或者放在你的用户名/.claude/skills/ 文件夹（claude code的安装位置）中

⚠️ 常见错误：Claudian 提示"技能未找到"。检查 Skills 文件是否放在了正确路径（.claude/skills/，注意开头有点号，是隐藏文件夹，Windows 需要开启"显示隐藏项目"才能看到）。

第六步：创建自定义 Skills（PDF 转换技能）

为了让 Claudian 能够直接调用 PDF 转 Markdown 脚本，需要创建两个自定义 Skill 文件。

Skill 的工作原理： 你在 Claudian 中输入 /pdfv1 路径，Claudian 会读取对应的 Skill 文件，将 {{inputPath}} 替换为你输入的路径，然后执行对应的命令。

在 .claude/skills/ 文件夹内，分别创建以下两个文件：

文件一：`pdfv1.md`（纯文本转换）

!bash "C:/Users/你的用户名/anaconda3/envs/marker_env/python.exe" -u "H:/ObsidianVaults/Scripts/pdf_to_obsidianV1.py" "{{inputPath}}"

文件二：`pdfv4.md`（全要素转换）

!bash cmd /c "chcp 65001 >nul && \"C:\\Users\\你的用户名\\anaconda3\\envs\\marker_env\\python.exe\" -X utf8 -u \"H:\\ObsidianVaults\\Scripts\\pdf_to_obsidianV4.py\" \"{{inputPath}}\""

说明：

将 你的用户名 替换为你 Windows 的实际用户名（可以在 C:\Users\ 下看到）
将 H:/ObsidianVaults/Scripts/ 替换为你实际存放脚本的路径
V4 版本的路径用的是双反斜杠 \\，这是 Windows 命令行的转义写法，不要改成单斜杠
Skill 文件内容里写的 {{inputPath}} 是一个占位符，Claudian 会自动把它替换成你输入的路径，你不需要手动修改

⚠️ 常见错误：运行技能后提示"系统找不到指定路径"。用文件管理器逐级检查路径是否真实存在，特别注意用户名和文件夹名称的大小写。

🎬 实战演示：地质学论文分析案例

完成以上六步配置后，下面演示完整的使用流程。

第一步：从 Zotero 复制 PDF 路径

在 Zotero 中，右键点击论文的 PDF 附件 → Zutilo → 复制附件路径。你会得到类似这样的路径：

E:\Zoterolib\storage\Y33IDUMB\Palinkaš2014_American Mineralogist_The role of magmatic and h.pdf

第二步：在 Claudian 中运行转换命令

在 Obsidian 的 Claudian 输入框中，输入：

/pdfv1 E:\Zoterolib\storage\Y33IDUMB\Palinkaš2014_American Mineralogist_The role of magmatic and h.pdf

耗时约 8 秒，输出纯文本 Markdown 笔记，自动保存到你配置的 Obsidian 笔记文件夹。

如果需要保留图表，改用 V4：

/pdfv4 E:\Zoterolib\storage\Y33IDUMB\Palinkaš2014_American Mineralogist_The role of magmatic and h.pdf

耗时约 14 秒，输出包含图片和表格的完整 Markdown 笔记。

第三步：让 AI 深度分析并生成 Canvas 图

转换完成后，在 Claudian 中输入：

@文献笔记/Palinkaš2014_American Mineralogist_The role of magmatic and h.md请详细分析这篇论文讲了什么，并调用 obsidian-canvas-creator 技能生成结构图

其中 @文献笔记/... 是 Claudian 的文件引用语法：@ 符号后面跟 Obsidian 库内的文件路径，AI 会自动读取该文件的内容进行分析。

进阶用法：多文献批量分析

你可以在一条消息里同时处理多篇论文，转换和分析一次完成：

/pdfv1 E:\Zoterolib\storage\R7HR7QUF\Van Lichtervelde2025_Chemical Geology_Dating multiple fractionat.pdfE:\Zoterolib\storage\LE3F83JW\Tang2025_American Mineralogist_Nb-Ta mineralization in a.pdf请执行上面的命令将这几篇论文转为 md 文档后，告诉我这几篇论文主要讲了什么

示例分析结果

🌟 核心优势

本地化处理：笔记和知识库完全本地存储，MinerU 转换过程通过加密 API 传输，转换完成后文件不留存于服务器
自动化工作流：从 PDF 到分析报告，一条命令完成
知识积累：每篇论文转换后形成永久 Markdown 笔记，构建属于你自己的知识库
批量处理：可一次性分析 20+ 篇文献，自动生成对比综述
可视化输出：自动生成 Canvas 思维导图、知识图谱等可视化结果

🔧 故障排除汇总

问题	可能原因	解决方法
Claude Code 卡顿、无响应	`alwaysThinkingEnabled` 未关闭	检查配置文件中 `"alwaysThinkingEnabled": false` 和 `"CLAUDE_THINKING_BUDGET_TOKENS": "0"`
API 连接失败（401/403）	API Key 填写错误	重新检查 Silicon Flow 控制台的 Key，确认没有多余空格
技能执行报错"找不到路径"	脚本路径有误	用文件管理器逐级检查路径，注意大小写和斜杠方向
Claudian 找不到技能	Skills 文件位置错误	确认文件在 `.claude/skills/` 下，Windows 需显示隐藏文件夹
PDF 转换失败	MinerU Token 无效或额度耗尽	登录 mineru.net 检查 Token 状态和剩余额度；目前是全免费的，也可考虑本地方案 docling（开源免费）作为备选，<https://github.com/docling-project/docling >
转换结果乱码	编码设置问题	V4 脚本中已包含 `chcp 65001` 强制 UTF-8，确认完整复制了命令

🎉 结语

到这里，整条工作流已经打通：文献获取 → 本地结构化 → AI 批量分析与输出。

看起来有点"折腾"，但本质上是把零散的论文，变成一个可以不断积累、反复调用的知识体系。相比在网页端一次次上传 PDF、一次次重新分析，本地化之后，AI 面对的是你整个数据库，而不只是单篇文献。

这意味着什么？你可以一次丢给它 10 篇、20 篇论文，让它去总结、对比、帮你搭综述框架，而你可以去喝杯咖啡、发会呆，甚至睡一觉，回来直接看结果。

如果喜欢，请点个关注！