大家好,这里是xuan酱。
今天上午AI大神卡帕西转发了一条来自Anthropic的Claude Code工程师Thariq的一篇长文,附了一大段评论。
原文标题很直接,「The Unreasonable Effectiveness of HTML」,翻译过来就是「HTML出奇的有效」。

文章大意是说,他已经几乎不再写Markdown文件了,所有需要输出内容的场景,全部交给Claude Code直接生成HTML。

他还做了一个示例站点,上面放了20个纯HTML文件,涵盖了代码审查、设计、数据报告、交互原型、幻灯片演示等9大类场景,每一个都是单文件,浏览器直接打开就能用,不需要任何其他工具。

这篇文章发出来之后直接爆了,1.5万个赞,1100多万浏览量。
然后卡帕西在转发的时候说了一段很有意思的话。
他说,你在跟AI对话结束的时候加一句「structure your response as HTML」(把你的回复结构化为HTML),然后用浏览器打开那个文件,效果可能会出乎你的想象。

最近关于Markdown还是HTML的讨论真是愈演愈烈了。
但其实我觉得根本没有争论的必要,分工不同,职责不同,没有可比性。
Markdown是AI时代的草稿纸,HTML是AI时代的PPT。
HTML是AI时代的PPT
我们先想一个问题,PPT到底是干什么的?
很多人觉得PPT就是做演示、做汇报用的。
表面上看是这样,但如果往深了想,PPT真正解决的问题是,如何把一堆复杂的信息,用视觉化的方式组织起来,让别人能快速看懂。
分块、排版、强调重点、降低认知负担、适合演示和传播。

这就是PPT的本质,一个低成本的结构化表达工具。
那HTML在AI时代扮演什么样的角色呢?
几乎一模一样的事情。
而且在很多方面,它比PPT还强。
HTML天然就是互联网的原生格式,它不需要安装任何软件,浏览器可以直接打开。它可以做卡片布局、时间线、对比表格、可折叠的内容块、带交互的按钮、甚至内嵌图表和动画。
更关键的是,在AI时代,做一个HTML的成本低到令人发指。
你不需要会写代码。你只需要跟Claude Code或者任何一个编码类Agent说一句,「帮我把这些内容做成一个HTML页面」,它就能给你生成一个完整的、带排版的、可以直接拿去演示的成品。
Thariq在他那个示例站点上展示的20个HTML,覆盖了从代码审查到设计到交互原型的几乎所有工作场景。

向下滑动查看全图
而这些东西,放在以前,你要么得自己做PPT,要么得找设计师,要么就只能用Markdown凑合。
现在一句话就出来了。
所以我觉得,HTML正在接替PPT在知识工作中的角色。
它不是取代PPT这个软件,而是取代PPT那个「把内容包装成可读可演示的成品」的功能定位。
HTML有什么用
Thariq在文章里列了很多HTML的优点。
在之前,Markdown之所以成为我们跟AI交互的默认格式,是因为它对人类来说很容易写,并且训练语料足够丰富,AI理解起来最容易。
但如果写的人是AI,那就没有必要限制在Markdown那有限的表达力里了。
很多时候AI给你写了一份特别完整的计划,逻辑也对,信息也全,但它就是一坨很长很长的Markdown。
不想看。
这点用AI的人应该都深有体会。
HTML的第一个用处,是提升信息密度。

它不只是能写标题、加粗、列表,还可以用表格呈现数据,用CSS做复杂样式,用SVG画插图。
也就是说,很多原本需要被压成文字的信息,都可以在HTML里变成更直观的界面。
所以Thariq吐槽了一个很有意思的场景,Claude Code有时候为了在Markdown里表达颜色,甚至会用Unicode字符去模拟色块。

这就有点抽象了。
不是Claude不聪明,是Markdown这个容器太小了。
HTML的第二个用处,是让内容更容易被读完。

同样是一份项目计划,Markdown版本可能是从上到下一百多行,标题下面套标题,列表里面套列表。
HTML版本可以左边是目录,右边是正文,中间穿插流程图,关键风险用颜色标出来,代码片段可以折叠,几个方案可以并排对比。
这两个东西的阅读体验完全不是一个量级。
不是因为HTML更高级,而是因为它更像一个真正的信息产品。
HTML的第三个用处,是分享更方便。
Markdown在代码编辑器里很好用,但你要发给朋友看,就没那么顺了。
浏览器不会原生渲染Markdown,你经常只能把它复制到飞书文档、Notion里再排一遍。
HTML就直接很多。
只要把文件上传到一个专门的托管平台,它就变成了一个链接。别人点开就能看,不需要装软件,也不用关心你是怎么生成的。

HTML还有一个很强的用法,是可以双向交互。
它不只是展示内容,还可以让你在里面操作,这是Markdown完全比不了的。
你可以在HTML页面里面点击提交按钮,可以打开或者关闭黑暗模式,可以拖拽移动元素位置。
这些东西用Markdown根本做不了。
Markdown并没有死
说到这,可能有人觉得我是在鼓吹HTML要取代Markdown了。
不是的。
我觉得这两个东西压根就不该放在一起比较谁高谁低。它们在AI时代的交互链路里,站在完全不同的位置上。
Markdown是什么?它是我们给AI的输入语言。
你想想看,当你跟Claude或者ChatGPT对话的时候,你怎么组织你的想法?
大部分人会用最朴素的自然语言,可能加上一些简单的结构,比如用#号分个层级,用-号列几个要点。
这就是Markdown,基础语法简单到几乎不需要学习,人类能读,AI也能理解,双方都很舒服。

而HTML呢?它是AI给我们的输出格式。
当AI把你的想法整理好、结构化好、视觉化好之后,用HTML包装出来,你打开浏览器就能看到一个精美的页面。
布局、配色、排版、交互,全都安排好了。
Markdown是过程,HTML是结果。
而且有一个很现实的问题。AI给你生成了一个HTML,你想改其中一句话怎么办?
在Markdown里改内容就像写字一样自然。
但在HTML里,你可能要在一堆<div>、<h1>、<class>标签里翻半天才能找到那句话在哪。
如果页面复杂一点,样式和内容混在一起,改一个地方可能连带着别的地方也崩了。
所以HTML适合阅读和展示,但并不适合人类直接编辑。Markdown适合编辑和推敲,但它的呈现力确实有限。
这不是谁比谁高级的问题,是分工问题。
Markdown适合跟AI一起思考,HTML适合把思考包装成可读、可演示、可交互的成品。
一个最典型的场景就是李继刚老师分享的。他说如果要对外做一个分享,他会花3个小时跟AI讨论他的思考框架,花半小时撰写文稿,然后花5分钟生成HTML。

你看,3个小时在思考,5分钟出成品。真正值钱的是前面的思考,不是后面的排版。
这恰好也证明了,Markdown和HTML不是替代关系。
你不可能跳过那3个小时的Markdown式思考,直接让AI给你一个好看的HTML,那出来的东西只是一个漂亮的空壳。
怎么用好它们
说了这么多,回到实际操作层面。
如果你想在自己的工作和学习中用好这两种格式,我的建议是分阶段来。
第一步,用Markdown跟AI一起思考。 把你的想法用最简单的方式丢给AI,让它帮你整理、补充、质疑。这个阶段不需要任何视觉效果,纯文本就行。重点是把内容打磨清楚。
第二步,内容确定了之后,让AI生成HTML。 你可以告诉它你想要什么风格、什么布局、面向什么受众。也可以用一些现成的skill,比如谷歌的design.md。

第三步,把做好的HTML分享出去。 这其实是很多人容易卡住的地方。HTML文件做好了,但怎么给别人看?
最简单的方式是直接发文件,对方用浏览器打开就行。
但如果你想更方便一点,想在线分享给别人,可以用一些免费的托管服务。比如Vercel、GitHub Pages、Netlify,把HTML文件往上一推,就有一个公开链接了。
如果你听不懂我刚才说的,可以把我刚才这句话直接发给AI,让AI帮你操作。
门槛真的已经低到不能再低了。
写在最后
回到卡帕西那条帖子。
他除了推荐大家试试让AI输出HTML之外,还画了一条更远的路线图。
他说A交互的演进是这样的,纯文本、Markdown、HTML,最后是交互式神经网络视频。

纯文本就像一本没有排版的大部头著作,信息量很大,但读着费劲。
Markdown加了目录、标题、表格,好看一些了,但本质还是线性的文字。
HTML有了布局、图形、交互,大部头变成了连环画,信息维度一下子丰富了。
而最终形态,可能是一种由AI模型直接生成的可交互视频,你可以暂停、提问、点击画面中的元素、让它换一种方式给你解释。
这话听起来有点科幻,但其实雏形已经出现了。
之前爆火的那个Flipbook应用,就是一个无限画布式的交互体验,用户可以在里面自由翻阅AI生成的视觉内容。

虽然离卡帕西说的「神经网络视频」还差得远,但方向已经在那了。
他还说了一点我觉得很重要的,不光是输出端在进化,输入端也需要进化。
现在我们跟AI交互主要靠打字和说话,但这还不够。
他说他经常有一种冲动,想用手指向屏幕上的某个东西然后说「改这里」,就像你跟一个坐在旁边的同事协作一样。

说真的,这个画面一想就让人觉得兴奋。
这不是一个「HTML比Markdown高级」的故事。这是AI时代内容生产流程重新分层的信号,Markdown负责思考,HTML负责呈现。
它们不是对手,是搭档。
就像卡帕西说的,人类跟AI之间的「心智融合」正在发生,而且还有很长的路要走。
从文字到网页到视频到空间交互,我们跟AI沟通的方式会越来越自然,摩擦会越来越低。
但不管交互方式怎么变,有一件事不会变。
AI可以帮你把想法做成HTML,但它没办法替你拥有想法。
这里是xuan酱,我们下期再见。88
夜雨聆风