PDF 复制出来全是乱的?微软刚开源了一个神器,一行命令全部转成 Markdown🦸 微软开源神器 · MarkItDown=== 漫画版 · 1 分钟看懂 ===📄➡️📝1😫「为什么复制出来的文字全是乱的!」每次要从 PDF / Word / Excel 里提内容给 AI…… 格式全崩、表格乱掉、图片没法处理 🤯格式转换噩梦2💡MarkItDown 来救你了!$pip install 'markitdown[all]'$markitdown 报告.pdf > 报告.md✅ 微软 AutoGen 团队出品 · 开源免费 · 今日 GitHub Trending #13📂 统统拿捏PDFWordPPTExcelHTML图片音频CSVJSONXMLEPUBYouTubeOutlookZIP⚡ 一行命令,全部转成 AI 最爱的 Markdown4🤔为什么是 Markdown?🔹 接近纯文本,Token 超省🔹 保留标题 / 列表 / 表格结构🔹 GPT-4o / Claude 天生就懂!🔹 官方称「highly token-efficient」5🤖AI 加持 · 连图片都懂from markitdown import MarkItDownfrom openai import OpenAImd = MarkItDown(llm_client=OpenAI(),llm_model="gpt-4o")result = md.convert("截图.png")🖼️ 图片丢进去 → 布局/流程/文字全解析成 Markdown6🔌MCP 集成— AI 助手直接读你的文档$pip install markitdown-mcp🤯 Claude Code / Cursor 中配好 MCP,AI 自己就能看 PDF/Word/Excel 来回答问题7⚔️ 和同类工具比怎么样?MarkItDowntextractPandoc输出格式✅ Markdown纯文本多种格式图片/音频✅ OCR + 转录❌❌Python API✅✅❌ CLI only开源✅ MIT✅ MIT✅ GPL👉 AI 场景选MarkItDown,它就是为这个造的8🎯谁该马上用?🤖 AI 开发者 — 文档预处理利器📝 内容创作者 — 批量迁到 Obsidian🏢 企业知识管理 — PDF/Word → 知识库🎓 研究人员 — 论文批量提取🛠️ 自动化工程师 — 构建文档管线9⚡ 3 秒上手$pip install 'markitdown[all]'$markitdown 文档.pdf > 文档.md⬇️ pip install▶️ 一行命令✅ 搞定📣 觉得有用?分享给需要的朋友!GitHub: github.com/microsoft/markitdown👇 关注我,每天分享 GitHub 热门好项目❤️ 在看⭐ 关注⭐ 在看数据来源: GitHub Trending · 2026.06.01