当AI在“读”你的文档:Markdown、HTML、TXT到底有什么区别?
一个奇怪的现象
你有没有注意到这样一个怪事?
我们用的AI编程工具(比如Cursor、GitHub Copilot),它们给AI看的不是代码本身,而是一个后缀为 .md 的文件——Markdown文件。
你让AI帮你写一篇文章,它输出的不是 article.txt 或 article.html,而是 article.md。
更有意思的是——如果你用Windows自带的记事本打开一个 .md 文件和一个 .txt 文件,它们看起来完全一样。都是黑底白字,都是纯文本。那张 .md 后缀的标签,在记事本眼里根本不存在。
这就像两个人穿着完全一样的校服走进教室,但老师说他们来自不同学校——你仔细一看,才发现其中一个人的校服袖口上缝了一个小标牌。Markdown和TXT的区别,大概就是这样。
而另一边,HTML就像一个穿着西装领带的人,扣子上还写着“请不要用记事本打开我”。
那问题来了:为什么AI行业绕了一大圈,选了看起来最简陋的Markdown?
第一章 | Markdown是怎么来的?
时间倒回2004年。
这时候还没有微信,没有iPhone,连Facebook都还没对公众开放。人们写博客的方式,要么是在线编辑器里点点点,要么直接在网页后台写HTML。
有个叫John Gruber的美国人,和一个叫Aaron Swartz的年轻人,在一起做了个决定:发明一个让普通人也能轻松写HTML的东西。
当时的背景是这样的:写HTML太繁琐了:一个标题要写 <h1>标题</h1>,一个列表要写 <ul><li>项目</li></ul>。写纯文本又太裸了:没有加粗、没有标题层级、没有链接。Word文档又太重了。
Markdown的核心理念很简单:用一种人看一眼就能懂的纯文本格式,来表示文档的结构。
Markdown就像文章的草稿纸。你用铅笔在纸上写,不用管排版,写完交给排版工去处理。——John Gruber
这个设计哲学后来深刻影响了整个互联网。GitHub用它写README,Reddit用它发帖子,Notion和Obsidian用它做笔记……Markdown成了互联网世界的普通话。
第二章 | 为什么AI代理工具都在用Markdown?
回答这个问题,得先搞清楚:AI怎么读文档?
想象你有一个超级聪明的助手,但他有个特殊要求:你给他的每一份材料,他都会认真读完。但他不是翻页读,而是一次性记住所有文字,然后根据记忆回答问题。
这就是AI大语言模型的工作方式。它读的不是页面,而是Token——你可以把Token理解为文字的最小计费单位。一个中文汉字大约等于1-2个Token。
现在问题来了:给AI读的文档,用什么格式最划算?
TXT:光溜溜的原始人
AI读TXT文件,就像看到一个原始人在山洞里生活——什么信息都没有失去,但什么也没有增加。它不知道哪个是标题、哪个是正文。全靠猜。
MD:有骨架但没穿衣服
AI读MD文件,就像看到一个骨架结构清晰的健身教练——它能明确知道哪里是标题、哪里是列表。更重要的是,MD的语法标记占用的Token非常少:一个 # 算1个Token。几乎不影响预算。
HTML:西装革履但负重太大
AI读HTML文件,就像看到一个穿着层层叠叠礼服的人——确实精致,但每一层都是负担。<h1>和</h1>要占Token,<a href=””>更是消耗大户。
算一笔账:假设一篇文章有10个标题、50个段落、20个加粗、10个链接:
Markdown版本:额外消耗约200-300个Token
HTML版本:额外消耗约800-1200个Token
在一篇5000字的文章里,HTML比MD多耗费大约50%-100%的Token。多出来的这些,换来的只是对人类更好看的样式。
这就像你给AI递资料的时候,用的不是A4纸,而是精装铜版纸。AI又不看纸的质感,它只认上面的字。你多花的钱,纯粹浪费在了包装上。
结论:在AI代理工具开发者眼里,Markdown是性价比最高的格式。语义丰富度远超TXT,Token开销远低于HTML。
第三章 | 当你在文本编辑器里打开MD
这可能是最让人困惑的一点。你打开记事本,输入一个标题,保存为 .txt 和 .md,看起来一模一样。
这就像你把同一张照片装进两个相框:一个写着 .jpg,一个写着 .png。从正面看,完全一样。但懂行的人知道,背后的压缩算法不同。
MD不是给记事本看的,是给能识别格式的编辑器看的。你用VS Code打开 .md,它有语法高亮;用Typora打开,它直接渲染成漂亮页面;给AI读,它能区分标题和正文。
在记事本里看MD,就像用老花镜看4K电视——不是电视不清晰,是你用的工具不对。
Markdown是一个多面孔的格式。在原始状态下(记事本)看起来就是TXT,但在有认知能力的工具里(AI、编辑器、GitHub),它能展现出丰富的结构信息。TXT是一张面孔——不管谁来看,都是文字。HTML是三张面孔——源代码像天书,渲染后像网页,AI读起来像扫码。
第四章 | 换成HTML,人类读起来更好吗?
答案毫无疑问:HTML更好。因为HTML在浏览器里会被渲染成漂亮的页面——有字体、有颜色、有排版。MD在浏览器里只是一张白纸黑字。
但这就像问:一个装在精美礼盒里的蛋糕,和一个装在塑料袋里的蛋糕,哪个送人更好看?当然是礼盒。但前提是你收到的是已经装好的礼盒,不是一卷包装纸、一把剪刀、一卷胶带和一盒颜料。
HTML的好看是有代价的:你需要配套的CSS样式文件、完整的页面结构、正确的标签嵌套。不然你可能看到的就是一行标签文本——比MD还难读。
一个形象的比喻:
TXT = 一张白纸
MD = 一张印了格线的信纸,顺着格子写,谁看了都知道该往哪看
HTML = 一个乐高积木套装,你能搭出任何东西——从城堡到一坨废料
第五章 | AI读HTML,会不会多花钱?
会的,而且多的不是一点点。
假设你写了一篇3000字的中文文章,包含1个主标题、6个副标题、3个代码块、2个表格、10个加粗、5个链接。
Markdown额外Token消耗:约80-120个Token
HTML额外Token消耗:约400-700个Token
单看一篇不多,但一天20篇、一个月30天、一年12个月——多花的钱,够请AI喝一年奶茶。
更重要的非财务成本:上下文窗口。AI的上下文窗口通常是128K-1M Token。HTML多占20%的Token,意味着AI留给思考的空间少了20%。这就像你给助手看的资料里20%都是排版说明。
|
维度 |
TXT |
MD |
HTML |
|
对AI的Token消耗 |
最低 |
低 |
中-高 |
|
有人类工具时可读性 |
差 |
好 |
最好 |
|
无工具时可读性 |
差 |
差 |
极差 |
|
语义丰富度 |
几乎为零 |
丰富 |
最丰富 |
|
最适用场景 |
纯数据存储 |
AI阅读/文档写作 |
Web页面展示 |
第六章 | 所以,到底该用啥?
有一个核心原则:谁读这个文件,就优先考虑谁的体验。
如果你的文档主要是给人看,用MD就够了,因为大多数平台会自动渲染。
如果你的文档主要是给AI看,用MD最好,Token最省、语义最清晰。
如果你的文档人和AI都要看,还是MD——它是两种读者的公约数。
如果你需要精确控制排版,用HTML+CSS。
想象你在一座孤岛上给远方的人发送消息。你有一个漂流瓶(TXT)、一只信鸽(MD)、和一架无人机(HTML)。漂流瓶谁都能丢但不知道信息级别;信鸽飞到对方手里时内容和格式都在;无人机能传高清照片但电池贵容易被发现。如果你只想说我很好,漂流瓶就够了。如果你想写一封家书,信鸽最好。在AI时代,信鸽是最佳伴侣——飞得足够远、带得足够多、成本足够低。
尾声 | 下一个问题
写到这里,其实只回答了一半的问题。还有另一个更深的趋势值得关注:AI会不会跳过所有这些文本格式,直接对话?
像Claude、ChatGPT现在的Artifacts功能,你给它说一句画一个图表,它直接生成SVG;你说展示一个页面,它直接生成HTML+CSS+JS。没有任何.md或.txt文件被创建。如果这个趋势继续下去,未来的文档格式可能变成这样:人类 ↔ AI ↔ 最终输出(HTML/PDF/视频/3D模型)。
到那时候,Markdown vs HTML vs TXT这个问题本身可能就变得不重要了。就像我们今天不会再问写信用毛笔还是钢笔一样——不是它们不好,是我们根本不用写信了。
但在此之前,在AI时代的这个早晨,Markdown依然是那个最称手的工具。不耀眼,不沉重,刚刚好。
夜雨聆风