如果你最近关注 AI 圈,尤其是 Anthropic 推出的 Claude Code,你可能会发现大佬们都在疯传一个"骚操作":别让 AI 给你发文档了,让它直接给你写 HTML 网页!
很多人纳闷:Markdown 不是挺好的吗?简洁、好读、程序员最爱。为什么要舍近求远去搞那种看起来很复杂的 HTML?
今天,我们就来拆解这场争论背后的深层逻辑。
AI 输出正在从静态文档跃升为动态界面——这不是技巧,而是一场范式转移。
一、Markdown 的"百行魔咒":AI 变强了,文档变累了
在过去,Markdown 是 AI 与我们沟通的默认语言。它简单、轻便,能加粗、能做表格。
但随着 AI 变得越来越聪明,问题出现了。开发者 Thariq 发现,当 AI 写的计划书或代码说明超过 100 行时,人类的阅读欲望会断崖式下跌。
为什么大家开始嫌弃 Markdown?
• 视觉贫瘠: Markdown 很难表现颜色和复杂的逻辑图。为了给你展示一个颜色,AI 甚至不得不费劲地用 Unicode 字符去"拼"出一个色块。
• 信息密度低: 面对海量信息,Markdown 只能让你"从头读到尾",这非常低效。
• 原生丑陋: 浏览器不会原生渲染 Markdown,分享出去往往需要对方再装一个工具。
Markdown 的天花板:100 行魔咒、表达受限、原生丑陋。
这是真实发生的——Claude Code 试图在 Markdown 里展示颜色,只能用 Unicode 字符一个个"拼"出色块。
二、Karpathy 的预言:大脑是一条"十车道超级高速公路"
AI 大神 Karpathy 提出了一个非常有意思的视角。他认为,人类与 AI 的交互存在"感官不对称":
• 输入: 我们喜欢用音频(说话最快)。
• 输出: 我们的大脑渴望视觉。
Karpathy 指出,人类大脑约有 1/3 的区域是专门处理视觉的并行处理器。他形象地称之为"进入大脑的十车道超级高速公路"。
相比之下,阅读文字(原始文本或 Markdown)就像是在羊肠小道上爬行,既费力又缓慢。
Karpathy 的"感官不对称":音频是人类向 AI 输入的首选,图像/动画/模拟是 AI 向人类输出的首选。大脑三分之一专门处理视觉。
他预言的 AI 输出进化路径是这样的:
原始文本(又硬又难读)
Markdown(稍微好点,目前的默认)
HTML(灵活、美观、可交互,正在成为新默认)
交互式神经视频/模拟(终极未来)
AI 输出的进化阶梯:HTML 是当前最具实用性的跃迁点——我们正处于 Markdown 和 HTML 的交界处。
三、降维打击:HTML 不只是文档,它是一个"临时应用"
为什么 HTML 能让大家直呼"回不去了"?因为它把 AI 的输出从"一张纸"变成了一个"工具箱"。
极致信息密度:HTML 可以在同一个页面里同时呈现表格数据、SVG 插图、空间数据和工作流——Markdown 做不到。
它能动起来: 你可以让 AI 在回复里加个滑动条、加个按钮,让你直接调整参数,而不是在对话框里反反复复改 Prompt。
它是"抛弃型编辑器": 比如你要重新排列 30 个任务,你可以让 AI 给你生成一个带"拖拽功能"的 HTML 页面。你排好了,点一下"复制",结果就传回给了 AI。
它更好分享: 给老板发一个 Markdown 附件,他可能懒得下软件看;但发一个 HTML 链接,浏览器一点就能开,颜值还高。
终极解锁:定制一次性界面——拖拽任务排好顺序后,一键"复制为提示词",结构化数据直接交回给 AI,形成完整闭环。
这不是在造产品,而是在按需生成一个用完即弃的专属工具。它解决完一个具体问题,就可以关掉。
用例画廊(一):规范生成与代码评审——AI 将复杂说明转为结构化 HTML,代码注释直接在页面侧边渲染,一眼看清变动。
用例画廊(二):原型设计与深度研究——从可实时调参的动画控制面板,到整合图表与注释的深度研究报告。
双向交互飞轮:人类编写提示 → AI 生成 HTML 界面 → 人工拖拽调优 → 复制为 JSON/提示词 → 反馈给 AI 执行。人机协作的完整闭环。
四、既然 HTML 这么好,为什么还有人在争?
Markdown vs HTML 全面诊断:从信息密度、可读性上限、交互性到分享方式,两者的真实差距一目了然。
争论的焦点主要在"成本"和"效率"上:
• 速度慢: 生成 HTML 网页的时间可能比普通文本慢 2-4 倍。
• 费 Token: HTML 代码很多,会消耗更多的 Token(也就是更贵)。
• 版本控制难: 对于程序员来说,HTML 的代码改动(Diff)非常混乱,不如 Markdown 清晰。
但正如 Thariq 所说,在现在大模型动辄 100 万长度的上下文(Context Window)面前,这点成本和人类的"认知效率"相比,简直微不足道。"人类能读懂并愿意阅读"的价值,远超节省的那点流量费。
实施手册:三大常见顾虑的直接解答——Token 消耗、生成速度与版本控制的真实权衡,没有绕弯子。
五、总结:从"回答机器"到"界面构建者"
人在回路中的悖论:HTML 不会取代人的主导性,它会放大这种主导性——高保真输出让你更愿意参与,而不是被动接收。
这场争论的本质是:AI 的角色变了。
以前我们把 AI 当成一个"问答机器",它吐出文字,我们负责阅读。
现在我们把 AI 当成一个 "UI 构建者"(UI Builder)。它不再仅仅是给你答案,而是为你量身定做一个解决问题的临时界面。
这标志着人类与 AI 的"心智融合"(Mind Meld)进入了一个新阶段。

本文素材参考自:
• Andrej Karpathy:https://x.com/karpathy/status/2053872850101285137
• Thariq(@trq212):https://x.com/trq212/status/2052809885763747935
AI趋势下,增长空间到底在哪里?
AI是风口还是泡沫?这个问题背后,真正的问题是:你能否在AI时代建立属于自己的认知秩序和行动框架?
5月,我们安排了连续5场直播,主题就叫——「探讨机会,更对AI祛魅」。
我们不谈空话,不做神话。字节、百度、科大讯飞的一线嘉宾,会拆解他们真实的玩法:


夜雨聆风