乐于分享
好东西不私藏

AI不吃Word,AI只吃Markdown

AI不吃Word,AI只吃Markdown

戳蓝字“小朱的学堂”关注我哦。

前段时间看到一条新闻,飞书终于支持导出Markdown格式了。官方菜单里多了个选项,文档里的图片也能被正确读取,保存到自己的服务器上然后给一个公网链接,让任何AI都能读到MD文件里的图片

社区喊了无数遍的功能,现在终于加上了。但有意思的是,如果你不用AI,甚至都不知道这件事有什么可激动的。飞书这么大一个更新,很多人的反应是:“不就是多了个导出格式吗,有啥用?”

可你要是天天跟AI打交道,就会知道这玩意儿到底有多香。

说实话,我已经想不起来是什么时候开始,再也不用PDF了,也不用Word了。电脑里存的所有的文本文件,几乎全是.md。我身边很多玩AI的朋友也都是这样。好像你AI用得越多,电脑里的md文件占比就越高。甚至有人开玩笑说,这个比例可以当AI浓度测量仪

这倒也不能全怪Word和PDF。它们本来就是为打印时代设计的,那个年代压根没有AI这回事。到了今天,AI反而成了推动文档格式演变的那个最野的力量。

1.

先说说Word和PDF的问题在哪。

咱们得先搞清楚一件事:Word和PDF诞生的时候,人类脑子里压根没有“AI会读我的文档”这个概念。它们的设计目标很单纯——长得好看、打印出来别走样。

但这对AI来说就是灾难。

你给AI扔一个PDF,它得先做OCR。一个长文档扫描完,大模型看一遍就要消耗几万甚至几十万的token。但你仔细想想,那些token大部分浪费在了读取“这行字在第几页、字体大小是多少、页眉页脚的线条该不该被识别”上面。PDF的设计是面向“最终成品”的,它把所有信息都打包在一个不可编辑的二进制文件里,靠固定的版式来保证“你看到的和我看到的是一样的”。这种设计对打印机和人类读者很贴心,但对需要理解内容的AI来说,版式信息全是噪音。

Word也没好到哪去。它的.docx本质上是压缩包里的XML,打开一个20MB的Word文档,解压出来的XML可能有上百MB,里面充斥着样式表、字体定义、段落格式代码。有一次我朋友用Word做技术文档,写完后用AI总结,结果AI把“标题样式1”和“正文”混在一起了,因为大模型无法分辨哪些XML是有效内容,哪些是用来描述的格式规则。换个软件打开,格式全乱。换个设备,更乱。想在手机上改一下,直接劝退。

说白了,Word和PDF的问题不是它们不好,而是它们的设计跟AI的思维方式八字不合。AI是个“食草动物”,只想吃干净、结构清晰的文本。Word和PDF这些东西就像一桌满汉全席,吃到一半的时候发现里面全是骨头,AI看着满盘子大肉就是咽不下去。

2.

那Markdown是怎么赢的?

Markdown这个东西说起来还挺有意思的。2004年一个叫John Gruber的博主遇到了一个特抓狂的问题——他在自己的博客上写东西,想要有标题、有加粗、有列表,但他又不想写HTML。那时候写HTML多崩溃啊,一个加粗要打<strong>标签,一篇文章写下来,一半时间花在各种尖括号上,内容没写多少,思路全断光了

Gruber就观察到一个现象:2004年的时候,大家在写邮件的时候已经自发形成了一套排版习惯——想强调一个词就在两边加星号,想列几个要点就用短横线开头,想写标题就在前面加几个井号。于是他灵机一动,把这些散落在邮件里的民间约定整理成了一套统一的语法,然后写了一个脚本,能把这个语法自动转成HTML

所以Markdown从诞生起就是“人写起来方便”的代名词。你不学HTML也能写出结构化的文档,而且写出来的东西本身就是纯文本,你用记事本就能打开它。

但真正让Markdown出圈的是GitHub。当GitHub把Markdown作为README标准后,整个开源社区一夜之间有了统一的文档语言。程序员们发现,用Markdown写文档比纯文本清晰、比Word方便、比HTML简洁。更关键的是,它是纯文本,可以在Git里做版本控制,每次修改都能清楚看到哪里变了。普通程序员几十万行代码都能跑通,一个文档文件当然不在话下。

后来就更猛了。你打开Claude的对话界面,那些加粗的、有标题的、有代码块的回复,看着排版很整齐对吧?底层全是Markdown。Deep Research生成的几十页长报告,拉到根目录看,也是一个.md文件。Markdown不知不觉成了数字世界的“通用语言”。但这一切被AI的介入彻底改变了。

3.

不过真正让我觉得这事儿到了拐点,是最近看到AI圈子里的一场论战。

Anthropic的Claude Code团队工程师Thariq在X上发表了一篇文章,标题挺唬人的,叫《Using Claude Code: The Unreasonable Effectiveness of HTML》。大意是说,他已经彻底抛弃了Markdown,全面转向让AI输出HTML。随后AI大神Karpathy也站出来说:“这招真的非常有效”

不少人看到这个,嘴里的饭差点喷出来。Markdown这不才成标准没几年吗,怎么就要被一个1991年就诞生的老家伙干掉?这跟时尚圈一样是个圈,三十年河东三十年河西,现在流行千禧年复古风了是吧

但理性地看,他们的逻辑其实不难理解。当你从“AI对话”变成“AI智能代理”后,AI输出的东西不再是几行回复,可能是几十上百行的报告、项目计划、设计文档。Markdown的线性结构超过100行就极其难读,Thariq本人就承认,他现在基本不读任何超过100行的Markdown文件了

但HTML就不一样。它可以用标签页组织内容、用折叠区块隐藏细节、用SVG画流程图,甚至加上可拖拽的滑块和实时预览的交互组件。同一个信息,Markdown给你一排干巴巴的文字列表,HTML给你一个可以直接操作的界面,哪种效率更高,一目了然。更功利一点说,HTML文件直接丢个链接就能分享,MD还要传附件,别人下载打开,手机一打开还经常错版。

Karpathy甚至画了一条进化路线:纯文本→Markdown→HTML→……由扩散模型直接生成的交互式视频/模拟系统。在他看来,AI输出的终点甚至可能不再是“文档”,而是某种实时生成、可交互、可操作的动态视觉内容。说白了就是把“文档”从静态变成可交互的程序。

这么一想就通了。Markdown的本质是“给人看、给人写”,但现在是AI帮人类看、帮人类写,人类只做审阅和微调。当你的角色从“创作者”变成“审阅者”,你需要的是好看、好读、信息分层一目了然,HTML显然更合适

但注意,这并不意味着你要回去写HTML。以前写HTML是噩梦,但现在AI帮你生成HTML,你根本不用写尖括号,你只需要把你的需求说清楚就行

4.

但你可能会问了:那以后Markdown是不是就彻底凉了?

我的判断是:不会凉,但Markdown和HTML的分工会更清晰。

Markdown跑在最底层的“数据交换层”——AI自己给自己看的时候、多个AI之间交换信息的时候、人类需要快速修改和微调的时候,Markdown仍然是最优解。它信噪比极高,没有多余的标签,AI几乎可以把所有算力都用去“思考内容”,而不是处理无谓的闭合标签。更重要的是,它容错率极高。AI生成HTML时少写一个</div>整个页面可能崩掉,但Markdown就算少写一个星号,内容一样能读

HTML跑在“人类审阅层”——当AI输出最终要给人类看、要分享、要在浏览器里呈现的时候,HTML能提供最好的阅读体验和交互能力。按照经济学原理,当一个智能体每天处理千万次对话,HTML用标签交互,Markdown用几个简单的符号表达层级,一年下来光是token成本就能差出几十万。不是Markdown不好,是HTML在某些场景下天生更擅长

那Word和PDF呢?说句不太客气的话,它们的角色会越来越像存档用的古董。正式报告、合同、论文这些需要“防篡改”和“版式固定”的场景,它们仍然是刚需。但如果你的目标是让AI帮你干活,你还把文档存在Word里,那就是在给自己找麻烦。我之前用过Word记AI笔记,带几张图就十几MB,云同步慢,修改变得磕磕绊绊;改用Markdown后,一篇才几KB,改的时候直接在文本上动手,那种流畅感完全不一样。

5.

那我们这些普通人该怎么做?

其实不需要想得太复杂。

如果你平时只是偶尔记点笔记、写写文档,完全不用纠结格式。但如果你已经开始大量使用AI写报告、做研究、整理知识,建议尽快把Markdown用起来。Markdown的学习成本几乎为零,你甚至不用专门去学——用几次AI,看AI给你返回的内容,你就能知道加粗怎么写、代码块怎么用。绝大多数产品界面都在主动拥抱Markdown。Obsidian、Notion、Typora这些工具都以Markdown为底层,从纯文本到极简渲染,再到双向链接与图谱视图,可编程化和本地优先的架构让你能无缝衔接AI工作流

更重要的是,掌握Markdown会让你获得一种“降维打击”的感觉。不是因为它有多复杂,而是因为它让你真正理解数字世界是怎么组织的。文档是内容,格式是衣服,两者可以分开。当你明白了这层关系,再回头看Word和PDF,你只会觉得它们的视角太窄。

Markdown这个东西确实有点微妙。它做人的时候不起眼,一旦和AI联手,就成了数字世界的“通行证”。

这大概就是底层规律的力量。你以为你在选格式,其实你是在选效率。