乐于分享
好东西不私藏

当AI在“读”你的文档:Markdown、HTML、TXT到底有什么区别?

当AI在“读”你的文档:Markdown、HTML、TXT到底有什么区别?

一个奇怪的现象

你有没有注意到这样一个怪事?

我们用的AI编程工具(比如Cursor、GitHub Copilot),它们给AI看的不是代码本身,而是一个后缀为 .md 的文件——Markdown文件。

你让AI帮你写一篇文章,它输出的不是 article.txt 或 article.html,而是 article.md。

更有意思的是——如果你用Windows自带的记事本打开一个 .md 文件和一个 .txt 文件,它们看起来完全一样。都是黑底白字,都是纯文本。那张 .md 后缀的标签,在记事本眼里根本不存在。

这就像两个人穿着完全一样的校服走进教室,但老师说他们来自不同学校——你仔细一看,才发现其中一个人的校服袖口上缝了一个小标牌。Markdown和TXT的区别,大概就是这样。

而另一边,HTML就像一个穿着西装领带的人,扣子上还写着“请不要用记事本打开我”。

那问题来了:为什么AI行业绕了一大圈,选了看起来最简陋的Markdown?

第一章 | Markdown是怎么来的?

时间倒回2004年。

这时候还没有微信,没有iPhone,连Facebook都还没对公众开放。人们写博客的方式,要么是在线编辑器里点点点,要么直接在网页后台写HTML。

有个叫John Gruber的美国人,和一个叫Aaron Swartz的年轻人,在一起做了个决定:发明一个让普通人也能轻松写HTML的东西。

当时的背景是这样的:写HTML太繁琐了:一个标题要写 <h1>标题</h1>,一个列表要写 <ul><li>项目</li></ul>。写纯文本又太裸了:没有加粗、没有标题层级、没有链接。Word文档又太重了。

Markdown的核心理念很简单:用一种人看一眼就能懂的纯文本格式,来表示文档的结构。

Markdown就像文章的草稿纸。你用铅笔在纸上写,不用管排版,写完交给排版工去处理。——John Gruber

这个设计哲学后来深刻影响了整个互联网。GitHub用它写README,Reddit用它发帖子,Notion和Obsidian用它做笔记……Markdown成了互联网世界的普通话。

第二章 | 为什么AI代理工具都在用Markdown?

回答这个问题,得先搞清楚:AI怎么读文档?

想象你有一个超级聪明的助手,但他有个特殊要求:你给他的每一份材料,他都会认真读完。但他不是翻页读,而是一次性记住所有文字,然后根据记忆回答问题。

这就是AI大语言模型的工作方式。它读的不是页面,而是Token——你可以把Token理解为文字的最小计费单位。一个中文汉字大约等于1-2个Token。

现在问题来了:给AI读的文档,用什么格式最划算?

TXT:光溜溜的原始人

AI读TXT文件,就像看到一个原始人在山洞里生活——什么信息都没有失去,但什么也没有增加。它不知道哪个是标题、哪个是正文。全靠猜。

MD:有骨架但没穿衣服

AI读MD文件,就像看到一个骨架结构清晰的健身教练——它能明确知道哪里是标题、哪里是列表。更重要的是,MD的语法标记占用的Token非常少:一个 # 算1个Token。几乎不影响预算。

HTML:西装革履但负重太大

AI读HTML文件,就像看到一个穿着层层叠叠礼服的人——确实精致,但每一层都是负担。<h1>和</h1>要占Token,<a href=””>更是消耗大户。

算一笔账:假设一篇文章有10个标题、50个段落、20个加粗、10个链接:

Markdown版本:额外消耗约200-300个Token

HTML版本:额外消耗约800-1200个Token

在一篇5000字的文章里,HTML比MD多耗费大约50%-100%的Token。多出来的这些,换来的只是对人类更好看的样式。

这就像你给AI递资料的时候,用的不是A4纸,而是精装铜版纸。AI又不看纸的质感,它只认上面的字。你多花的钱,纯粹浪费在了包装上。

结论:在AI代理工具开发者眼里,Markdown是性价比最高的格式。语义丰富度远超TXT,Token开销远低于HTML。

第三章 | 当你在文本编辑器里打开MD

这可能是最让人困惑的一点。你打开记事本,输入一个标题,保存为 .txt 和 .md,看起来一模一样。

这就像你把同一张照片装进两个相框:一个写着 .jpg,一个写着 .png。从正面看,完全一样。但懂行的人知道,背后的压缩算法不同。

MD不是给记事本看的,是给能识别格式的编辑器看的。你用VS Code打开 .md,它有语法高亮;用Typora打开,它直接渲染成漂亮页面;给AI读,它能区分标题和正文。

在记事本里看MD,就像用老花镜看4K电视——不是电视不清晰,是你用的工具不对。

Markdown是一个多面孔的格式。在原始状态下(记事本)看起来就是TXT,但在有认知能力的工具里(AI、编辑器、GitHub),它能展现出丰富的结构信息。TXT是一张面孔——不管谁来看,都是文字。HTML是三张面孔——源代码像天书,渲染后像网页,AI读起来像扫码。

第四章 | 换成HTML,人类读起来更好吗?

答案毫无疑问:HTML更好。因为HTML在浏览器里会被渲染成漂亮的页面——有字体、有颜色、有排版。MD在浏览器里只是一张白纸黑字。

但这就像问:一个装在精美礼盒里的蛋糕,和一个装在塑料袋里的蛋糕,哪个送人更好看?当然是礼盒。但前提是你收到的是已经装好的礼盒,不是一卷包装纸、一把剪刀、一卷胶带和一盒颜料。

HTML的好看是有代价的:你需要配套的CSS样式文件、完整的页面结构、正确的标签嵌套。不然你可能看到的就是一行标签文本——比MD还难读。

一个形象的比喻:

TXT = 一张白纸

MD = 一张印了格线的信纸,顺着格子写,谁看了都知道该往哪看

HTML = 一个乐高积木套装,你能搭出任何东西——从城堡到一坨废料

第五章 | AI读HTML,会不会多花钱?

会的,而且多的不是一点点。

假设你写了一篇3000字的中文文章,包含1个主标题、6个副标题、3个代码块、2个表格、10个加粗、5个链接。

Markdown额外Token消耗:约80-120个Token

HTML额外Token消耗:约400-700个Token

单看一篇不多,但一天20篇、一个月30天、一年12个月——多花的钱,够请AI喝一年奶茶。

更重要的非财务成本:上下文窗口。AI的上下文窗口通常是128K-1M Token。HTML多占20%的Token,意味着AI留给思考的空间少了20%。这就像你给助手看的资料里20%都是排版说明。

维度

TXT

MD

HTML

AI的Token消耗

最低

-高

有人类工具时可读性

最好

无工具时可读性

极差

语义丰富度

几乎为零

丰富

最丰富

最适用场景

纯数据存储

AI阅读/文档写作

Web页面展示

第六章 | 所以,到底该用啥?

有一个核心原则:谁读这个文件,就优先考虑谁的体验。

如果你的文档主要是给人看,用MD就够了,因为大多数平台会自动渲染。

如果你的文档主要是给AI看,用MD最好,Token最省、语义最清晰。

如果你的文档人和AI都要看,还是MD——它是两种读者的公约数。

如果你需要精确控制排版,用HTML+CSS。

想象你在一座孤岛上给远方的人发送消息。你有一个漂流瓶(TXT)、一只信鸽(MD)、和一架无人机(HTML)。漂流瓶谁都能丢但不知道信息级别;信鸽飞到对方手里时内容和格式都在;无人机能传高清照片但电池贵容易被发现。如果你只想说我很好,漂流瓶就够了。如果你想写一封家书,信鸽最好。在AI时代,信鸽是最佳伴侣——飞得足够远、带得足够多、成本足够低。

尾声 | 下一个问题

写到这里,其实只回答了一半的问题。还有另一个更深的趋势值得关注:AI会不会跳过所有这些文本格式,直接对话?

Claude、ChatGPT现在的Artifacts功能,你给它说一句画一个图表,它直接生成SVG;你说展示一个页面,它直接生成HTML+CSS+JS。没有任何.md或.txt文件被创建。如果这个趋势继续下去,未来的文档格式可能变成这样:人类 ↔ AI ↔ 最终输出(HTML/PDF/视频/3D模型)。

到那时候,Markdown vs HTML vs TXT这个问题本身可能就变得不重要了。就像我们今天不会再问写信用毛笔还是钢笔一样——不是它们不好,是我们根本不用写信了。

但在此之前,在AI时代的这个早晨,Markdown依然是那个最称手的工具。不耀眼,不沉重,刚刚好。