微软那个把所有文件转 Markdown 的工具,终于有可视化版了
最近经常被问到同一个问题:
“喂大模型用的资料,到底要不要先转成 Markdown?”
我的答案是,要。
Word 的样式标签、PDF 的版面噪音,喂进模型里很容易让结构乱掉。Markdown 没有这些包袱——纯文本,但标题、列表、表格都保留。同一份文件,扔进 ChatGPT、Claude、Cursor、本地 RAG,解析出来都不跑偏。
跨平台也舒服。一份 .md,往 GitHub、Notion、飞书、公众号编辑器里一贴,格式基本不用调。
但问题来了——
谁的资料是直接长在 Markdown 里的?
大部分人手头还是 PDF、DOCX、PPTX、XLSX。
手动转嘛,慢,还经常丢表格、丢层级。
找在线工具嘛,合同、方案、客户名单这种东西,谁敢往上传。
去年微软开源了一个命令行工具,叫 MarkItDown,专门做这件事,转换质量在开发者圈口碑一直不错。
但它有个门槛——命令行。
让产品、运营、法务的同事打开终端敲 pip install?算了。
好在,炮哥基于 MarkItDown 做了个可视化 Web 版。上传文件,点一下,Markdown 直接下载。

界面简洁,上传即转
支持 12 种格式
• 办公文档:PDF、DOCX、PPTX、XLSX
• 技术格式:HTML、CSV、JSON、XML、IPYNB
• 其他:ZIP(自动遍历批量转)、EPUB、MSG(邮件)
音频和图片暂时没做,后续会补。代码已开源,欢迎技术朋友一起完善。

Word 转换效果

一键保存到本地
但 Web 版,还不是炮哥这次最想推的东西。
真正解决问题的是 离线版。
合同、方案、内部架构图——这些东西不能上传任何服务器。哪怕工具承诺“不存储”,企业合规这关也过不了。
所以离线版做成了桌面端:
双击安装,本地运行,文件不出本机。
不用配 Python,不用拉镜像。
支持企业内网部署,团队内部共享也不外发。
到这一步基本就是开箱即用——下载、安装、转换、结束。

内网离线桌面端
最后
这工具没什么黑科技,就是把一个原本要敲命令行的事情做得人人能用。但 AI 工作流越来越离不开 Markdown 的当下,能把门槛抹平的小工具,往往才是真的能用起来的那一种。
网页版、桌面端都免费。
链接评论区见。
夜雨聆风