版面分析:自动识别标题、正文、图表、页眉页脚,按正确的阅读顺序输出。双栏排版的论文也不会串行。
OCR 识别:扫描件、盖章的红头文件这类没有文字层的 PDF,也能"读"出来,支持中英等上百种语言。
表格识别:表格转成 HTML 或 Markdown,处理带数据的报表、结算细则很实用。
公式识别:数学公式转 LaTeX。
自动去噪:把页眉、页脚、页码这些干扰内容剔掉,保证语义连贯。
pip3 install uv -i https://mirrors.aliyun.com/pypi/simple/uv-imkdir -p ~/mineru && cd ~/mineruuv venv --python 3.12source .venv/bin/activate
uv pip install ”mineru[core]” -i https://mirrors.aliyun.com/pypi/simple/[core]export MINERU_MODEL_SOURCE=modelscopemineru-models-download -s modelscope -m pipeline
-m pipelinemineru.jsonmineru -p 测试文件.pdf -o ./output -b pipeline-p是输入的 PDF,-o是输出目录,-b pipeline--method ocrmineru -p 扫描件.pdf -o ./output -b pipeline --method ocr.mdpdf2obsidian.sh#!/bin/bashsource ~/mineru/.venv/bin/activateexport MINERU_MODEL_SOURCE=localSRC=”$1”# PDF 来源目录(运行时传入)VAULT=”$HOME/Obsidian/你的Vault/PDF转换”# ← 改成你的 Vault 路径for pdf in ”$SRC”/*.pdf; doname=$(basename ”$pdf” .pdf)echo ”▶ 处理: $name”mineru -p ”$pdf” -o ”$VAULT/$name” -b pipelinedoneecho ”✅ 全部完成”
MINERU_MODEL_SOURCE=localSRC="$1"chmod +x pdf2obsidian.sh./pdf2obsidian.sh ~/Downloads/待转PDF
chmod +x./mkdir ~/mineru && cd ~/mineru~/minerumkdir&&cd ~/mineru~/mineru(hydtzyj)(mineru)~/mineru/.venv&& 换成 ;mkdir -p(-p表示目录已存在也不报错)。我上面的主线教程里已经改成了mkdir -pdeactivatecduv venvmineru-gradioRemoteProtocolError 和 Server disconnectedhttp_proxy.py127.0.0.1export no_proxy=”localhost,127.0.0.1”export NO_PROXY=”localhost,127.0.0.1”
no_proxy~/.zshrcno_proxymodel.safetensors,2.31GB,速度还慢。Using transformers as the inference engine for VLMCtrl+C-b pipeline,就不会触发 VLM 下载;Gradio 网页界面里,把后端下拉框选成 pipeline 即可。我上面所有命令都加了-b pipeline-b vlm-mlx-engine-b vlm-auto-engineImportError: cannot import name 'find_pruneable_heads_and_indices'uv pip install ”mineru[core]” -i https://mirrors.aliyun.com/pypi/simple/Path does not existmineru -ppermission denied提示符前必须是
(mineru)本地服务启动失败,先查
no_proxy日常一律
-b pipeline敏感文件只走命令行,绝不碰桌面客户端
夜雨聆风