乐于分享
好东西不私藏

Word转Markdown,我试了三个方法,最后只用一个

Word转Markdown,我试了三个方法,最后只用一个

我先交代一下背景:我平时写东西用Typora,就是直接敲Markdown格式。但有时候要跟别人协作,人家发过来的是Word文档,你得转成Markdown才能接着用。

这个转换问题,我踩过不少坑,今天说个清楚。


Markdown是什么,它从哪来的?

Markdown这个东西,其实挺有故事的。

2004年,有个叫John Gruber的人,跟他朋友Aaron Swartz一起,搞出了Markdown。他们不是什么大公司的工程师,就是两个写博客的人。

为什么会做这个东西呢?

因为当时写博客太痛苦了。你想给文章加个标题、加粗一段文字、加个链接,都要手动写HTML代码。加粗、文字,这些标签看着就让人头疼,写着写着注意力全在代码上,内容反而顾不上了。

Gruber就想:有没有一种更简单的写法,让写作的人不用懂代码,也能表达”这是标题””这是加粗””这是链接”?

于是Markdown诞生了。它的核心逻辑就是:用一些极简的符号,代表格式。

比如

标题——井号加空格,就是一级标题。

**加粗**——两个星号包起来,就是加粗。

[文字](链接)——中括号套小括号,就是链接。

写的人不用管HTML,不用管代码,只需要记住这几个符号,就能表达所有格式。这就是Markdown最初的设计哲学:让写作的人专注于内容,而不是排版。


Markdown为什么突然又被带起来了?

Markdown是2004年出来的,在程序员和写作者的小圈子里一直有人用,但真正大火,是这两年AI来了之后的事。

为什么?

因为AI处理纯文本的能力,比处理Word文档强太多了。

你丢给AI一段Markdown,它能直接读懂哪里是标题、哪里是重点、哪里是代码块、哪里有链接。结构清晰,格式无损。

你丢给AI一个Word文档试试?格式有时候会乱,有时候干脆读不出来,不同软件打开还不一样。AI最怕这种不稳定。

所以这两年你会看到一个明显的趋势:越来越多的写作工具、笔记软件、知识库、博客平台,都开始原生支持Markdown格式。

Typora、Obsidian、飞书文档、Notion、很多AI写作工具——它们底层都是Markdown。


所以问题来了:Word转Markdown这件事,变得比以前重要多了。

你可能觉得,自己写东西用Word挺好的,没必要换。

但你想想这几个场景:

你用AI帮你写文章,你希望AI给你输出什么格式?Markdown对AI最友好,输出最稳定,你拿去就能用。

你用知识库工具整理资料,别人给你的都是Word文档,你得转成Markdown才能导进去。

你在多个平台同步发布内容,Markdown一次写好,改格式的成本最低。

Word转Markdown,已经不是一个技术偏好问题了,而是AI时代的基本功。


方法一:Pandoc(最专业,但有点门槛)

Pandoc是一个命令行工具,被称为”文档转换瑞士军刀”,它能实现几乎所有文档格式之间的转换,包括Word到Markdown。

操作方法:

去 Pandoc 官网下载安装包,双击安装

打开终端(Windows按Win+R,输入cmd)

输入一行命令:pandoc “你的文档.docx” -o 输出.md

几秒钟之后,你的Markdown文件就生成了。

它的优点是:

转换质量很高,表格、标题、序号这些基本不会出错。能保留比较完整的格式信息。

它的缺点是:

命令行对完全不懂技术的人来说,还是有点心理障碍的。另外它输出的Markdown格式有时候偏复杂,如果你的Markdown编辑器不支持某些扩展语法,可能要手动微调一下。

适合谁:

愿意学一次,以后一直用的人。


方法二:Word自带导出(最简单,但最不推荐)

Word其实可以直接另存为纯文本,但格式会全部丢失,基本等于没用。

稍微好一点的是:Word可以另存为HTML格式,然后用工具把HTML转成Markdown。这个路径是通的,但中间步骤太多,折腾一圈下来不如用其他方法。

我试过几次,每次都出各种奇怪问题——图片路径乱掉、表格格式不对——后来就放弃了。

适合谁:

临时应急、不追求格式准确的场景。


方法三:在线转换工具(我目前的主力)

这是我现在用得最多的方法,原因是:零门槛,打开就用,不需要装任何东西。

目前用的是convertio.co——支持Word直接转Markdown,上传文件,点转换,下载结果,全程不超过一分钟。

它的优点是:界面干净,操作傻瓜,转换质量在日常使用场景下足够好,标题、段落、基本表格都能保留。

它的缺点是:免费版有文件大小限制,大文档要付费;另外有些复杂的Word格式,比如多级序号、特殊脚注,转换后还是要手动调整,但这种情况本来就不多。

另一个常用的是word2md.com,专门做Word转Markdown,功能更纯粹,没有广告,界面是英文的。


我的实际工作流是什么?

我现在遇到别人发来Word文档的场景,基本是这样处理的:

第一步,先用Pandoc跑一遍,命令行敲一行字,几秒钟出结果。如果格式复杂,再用在线工具转一遍,对比两个版本,取质量更好的那个。

第二步,打开Typora,把转换后的Markdown文件打开,检查一遍。主要看表格有没有乱、标题层级对不对、图片路径有没有问题。发现小问题手动修一下。

第三步,用AI工具帮我检查一遍语法和逻辑,这个步骤其实比想象中省时间。

一个Word文档转Markdown并检查完毕,大概五到十分钟。比之前反复复制粘贴、格式错乱、一遍遍重来的体验好太多了。


总结

如果你完全不想要门槛,就用在线转换工具网页版,零学习成本,临时用完全够。

如果你愿意学一次,追求更稳定、更专业的转换质量,把Pandoc装上,以后遇到Word文档直接命令行一跑就行。

两种方法不冲突,可以同时用。