当AI在“读”你的文档:Markdown、HTML、TXT到底有什么区别?-夜雨聆风

当AI在“读”你的文档:Markdown、HTML、TXT到底有什么区别?

一个奇怪的现象

你有没有注意到这样一个怪事？

我们用的AI编程工具（比如Cursor、GitHub Copilot），它们给AI看的不是代码本身，而是一个后缀为 .md 的文件——Markdown文件。

你让AI帮你写一篇文章，它输出的不是 article.txt 或 article.html，而是 article.md。

更有意思的是——如果你用Windows自带的记事本打开一个 .md 文件和一个 .txt 文件，它们看起来完全一样。都是黑底白字，都是纯文本。那张 .md 后缀的标签，在记事本眼里根本不存在。

这就像两个人穿着完全一样的校服走进教室，但老师说他们来自不同学校——你仔细一看，才发现其中一个人的校服袖口上缝了一个小标牌。Markdown和TXT的区别，大概就是这样。

而另一边，HTML就像一个穿着西装领带的人，扣子上还写着“请不要用记事本打开我”。

那问题来了：为什么AI行业绕了一大圈，选了看起来最简陋的Markdown？

第一章 | Markdown是怎么来的？

时间倒回2004年。

这时候还没有微信，没有iPhone，连Facebook都还没对公众开放。人们写博客的方式，要么是在线编辑器里点点点，要么直接在网页后台写HTML。

有个叫John Gruber的美国人，和一个叫Aaron Swartz的年轻人，在一起做了个决定：发明一个让普通人也能轻松写HTML的东西。

当时的背景是这样的：写HTML太繁琐了：一个标题要写 <h1>标题</h1>，一个列表要写 <ul><li>项目</li></ul>。写纯文本又太裸了：没有加粗、没有标题层级、没有链接。Word文档又太重了。

Markdown的核心理念很简单：用一种人看一眼就能懂的纯文本格式，来表示文档的结构。

Markdown就像文章的草稿纸。你用铅笔在纸上写，不用管排版，写完交给排版工去处理。——John Gruber

这个设计哲学后来深刻影响了整个互联网。GitHub用它写README，Reddit用它发帖子，Notion和Obsidian用它做笔记……Markdown成了互联网世界的普通话。

第二章 | 为什么AI代理工具都在用Markdown？

回答这个问题，得先搞清楚：AI怎么读文档？

想象你有一个超级聪明的助手，但他有个特殊要求：你给他的每一份材料，他都会认真读完。但他不是翻页读，而是一次性记住所有文字，然后根据记忆回答问题。

这就是AI大语言模型的工作方式。它读的不是页面，而是Token——你可以把Token理解为文字的最小计费单位。一个中文汉字大约等于1-2个Token。

现在问题来了：给AI读的文档，用什么格式最划算？

TXT：光溜溜的原始人

AI读TXT文件，就像看到一个原始人在山洞里生活——什么信息都没有失去，但什么也没有增加。它不知道哪个是标题、哪个是正文。全靠猜。

MD：有骨架但没穿衣服

AI读MD文件，就像看到一个骨架结构清晰的健身教练——它能明确知道哪里是标题、哪里是列表。更重要的是，MD的语法标记占用的Token非常少：一个 # 算1个Token。几乎不影响预算。

HTML：西装革履但负重太大

AI读HTML文件，就像看到一个穿着层层叠叠礼服的人——确实精致，但每一层都是负担。<h1>和</h1>要占Token，<a href=””>更是消耗大户。

算一笔账：假设一篇文章有10个标题、50个段落、20个加粗、10个链接：

Markdown版本：额外消耗约200-300个Token

HTML版本：额外消耗约800-1200个Token

在一篇5000字的文章里，HTML比MD多耗费大约50%-100%的Token。多出来的这些，换来的只是对人类更好看的样式。

这就像你给AI递资料的时候，用的不是A4纸，而是精装铜版纸。AI又不看纸的质感，它只认上面的字。你多花的钱，纯粹浪费在了包装上。

结论：在AI代理工具开发者眼里，Markdown是性价比最高的格式。语义丰富度远超TXT，Token开销远低于HTML。

第三章 | 当你在文本编辑器里打开MD

这可能是最让人困惑的一点。你打开记事本，输入一个标题，保存为 .txt 和 .md，看起来一模一样。

这就像你把同一张照片装进两个相框：一个写着 .jpg，一个写着 .png。从正面看，完全一样。但懂行的人知道，背后的压缩算法不同。

MD不是给记事本看的，是给能识别格式的编辑器看的。你用VS Code打开 .md，它有语法高亮；用Typora打开，它直接渲染成漂亮页面；给AI读，它能区分标题和正文。

在记事本里看MD，就像用老花镜看4K电视——不是电视不清晰，是你用的工具不对。

Markdown是一个多面孔的格式。在原始状态下（记事本）看起来就是TXT，但在有认知能力的工具里（AI、编辑器、GitHub），它能展现出丰富的结构信息。TXT是一张面孔——不管谁来看，都是文字。HTML是三张面孔——源代码像天书，渲染后像网页，AI读起来像扫码。

第四章 | 换成HTML，人类读起来更好吗？

答案毫无疑问：HTML更好。因为HTML在浏览器里会被渲染成漂亮的页面——有字体、有颜色、有排版。MD在浏览器里只是一张白纸黑字。

但这就像问：一个装在精美礼盒里的蛋糕，和一个装在塑料袋里的蛋糕，哪个送人更好看？当然是礼盒。但前提是你收到的是已经装好的礼盒，不是一卷包装纸、一把剪刀、一卷胶带和一盒颜料。

HTML的好看是有代价的：你需要配套的CSS样式文件、完整的页面结构、正确的标签嵌套。不然你可能看到的就是一行标签文本——比MD还难读。

一个形象的比喻：

TXT = 一张白纸

MD = 一张印了格线的信纸，顺着格子写，谁看了都知道该往哪看

HTML = 一个乐高积木套装，你能搭出任何东西——从城堡到一坨废料

第五章 | AI读HTML，会不会多花钱？

会的，而且多的不是一点点。

假设你写了一篇3000字的中文文章，包含1个主标题、6个副标题、3个代码块、2个表格、10个加粗、5个链接。

Markdown额外Token消耗：约80-120个Token

HTML额外Token消耗：约400-700个Token

单看一篇不多，但一天20篇、一个月30天、一年12个月——多花的钱，够请AI喝一年奶茶。

更重要的非财务成本：上下文窗口。AI的上下文窗口通常是128K-1M Token。HTML多占20%的Token，意味着AI留给思考的空间少了20%。这就像你给助手看的资料里20%都是排版说明。

维度	TXT	MD	HTML
对AI的Token消耗	最低	低	中-高
有人类工具时可读性	差	好	最好
无工具时可读性	差	差	极差
语义丰富度	几乎为零	丰富	最丰富
最适用场景	纯数据存储	AI阅读/文档写作	Web页面展示

第六章 | 所以，到底该用啥？

有一个核心原则：谁读这个文件，就优先考虑谁的体验。

如果你的文档主要是给人看，用MD就够了，因为大多数平台会自动渲染。

如果你的文档主要是给AI看，用MD最好，Token最省、语义最清晰。

如果你的文档人和AI都要看，还是MD——它是两种读者的公约数。

如果你需要精确控制排版，用HTML+CSS。

想象你在一座孤岛上给远方的人发送消息。你有一个漂流瓶（TXT）、一只信鸽（MD）、和一架无人机（HTML）。漂流瓶谁都能丢但不知道信息级别；信鸽飞到对方手里时内容和格式都在；无人机能传高清照片但电池贵容易被发现。如果你只想说我很好，漂流瓶就够了。如果你想写一封家书，信鸽最好。在AI时代，信鸽是最佳伴侣——飞得足够远、带得足够多、成本足够低。

尾声 | 下一个问题

写到这里，其实只回答了一半的问题。还有另一个更深的趋势值得关注：AI会不会跳过所有这些文本格式，直接对话？

像Claude、ChatGPT现在的Artifacts功能，你给它说一句画一个图表，它直接生成SVG；你说展示一个页面，它直接生成HTML+CSS+JS。没有任何.md或.txt文件被创建。如果这个趋势继续下去，未来的文档格式可能变成这样：人类 ↔ AI ↔ 最终输出（HTML/PDF/视频/3D模型）。

到那时候，Markdown vs HTML vs TXT这个问题本身可能就变得不重要了。就像我们今天不会再问写信用毛笔还是钢笔一样——不是它们不好，是我们根本不用写信了。

但在此之前，在AI时代的这个早晨，Markdown依然是那个最称手的工具。不耀眼，不沉重，刚刚好。