你有没有遇到过这种情况——
收到一份 PDF 合同,想让 AI 帮你分析,但 AI 读不了 PDF。
或者手里有个 Word 文档,想转成 Markdown 丢给其他工具,但转完格式全乱了。
现在微软开源了一个工具,叫 markitdown,专门解决这个问题。
这是什么
markitdown 是一个 Python 工具,专门把各种格式的文档转成 Markdown。
GitHub 上今天刚上榜,来自微软官方。
支持格式:PDF、Word、Excel、PowerPoint、图片(OCR)、音频(转写)、HTML、CSV/JSON/XML、ZIP、YouTube 链接、EPub……
一句话:丢什么进去,还你什么 Markdown。
仓库:https://github.com/microsoft/markitdown
为什么值得注意
Markdown 是 AI 最熟悉的格式。
GPT-4o 原生支持 Markdown,它理解 Markdown 的效果远好于理解 PDF 或 Word。
markitdown 的核心价值就是——让任何文档都能无缝进入 AI 工作流。
变现思路
💰 思路一:做成 API 服务卖钱
很多人不会配 Python 环境,也不想装依赖。把 markitdown 封装成 API,按转换次数收费。
关键优势:Markdown 是刚需,AI 时代需求猛增,你几乎没有竞争对手。
💰 思路二:卖给知识管理工具开发者
很多笔记软件和知识库产品需要文档解析能力。基于 markitdown 提供定制化模块,按授权费或项目制收费。
💰 思路三:打包成桌面工具卖订阅
做一个跨平台桌面客户端,拖入文件就自动转 Markdown。高级版加批量处理、云端同步,卖月订阅。
怎么用
pip install markitdown from markitdown import MarkItDown md = MarkItDown() result = md.convert("合同.pdf") print(result.text_content)一行代码搞定。
一句话:文档转 Markdown 这个需求,在 AI 时代会越来越大。微软帮你把最难的部分做了,剩下的变现空间是你的。
夜雨聆风