核心观点

这不是技术迭代,这是信息载体的人类学转向。在 AI Agent 全面介入工作流之前,我们需要重新思考一个根本问题:什么样的文档格式,能同时被人类和机器高效地阅读、理解和编辑?
答案是 Markdown、CSV、HTML。
一、为什么是这三兄弟
1.1 Markdown:文本的原子化结构
Markdown 的本质是一个轻量级标记语言。它用极简的符号(#、*、-、>)构建层级结构,用纯文本实现了格式化。这让它具备了几个关键特性:
Word 的问题在于它是一个二进制容器。.docx 本质上是一个 ZIP 包,里面塞满了 XML 和资源文件。当你尝试让 Agent 解析一份 Word 文档时,你实际上在要求它理解 Microsoft 的私有规范。而 Markdown?它就是文本,任何大语言模型从第一天就能理解它。
1.2 CSV:数据的本真表达
CSV(Comma-Separated Values)看似原始,但它遵循一个核心哲学:数据的结构应该由数据本身决定,而不是由软件决定。
Excel 是一个应用软件,它有自己的数据类型系统(日期、数字、货币、百分比)、格式化规则、公式引擎、图表引擎。当 Agent 要操作 Excel 时,它需要理解这一整套上下文。
CSV 不同。它只有两个概念:行和列,用分隔符(通常是逗号)连接。每一行是一条记录,每一列是一个字段。这是一种图灵完备的数据表达方式——任何关系型数据库、任何数据分析工具、任何 AI 模型都能无歧义地处理它。
name,age,city,score
Alice,28,Beijing,92
Bob,35,Shanghai,88
Charlie,31,Shenzhen,95
这四行文本,任何 Agent 都能在 0.1 秒内理解其结构。
1.3 HTML:结构化展示的标准答案
PPT 的核心功能是展示——把信息以视觉化、结构化的方式呈现给观众。而 HTML 是 Web 的展示标准,它解决的问题和 PPT 一样,但开放得多:
语义化结构:
header、section、article、figure这些标签天然就是演示文稿的「标题页」「章节」「内容」「图表」响应式布局:一份 HTML 可以适配手机、平板、投屏,PPT 需要为不同屏幕准备不同设置
样式分离:CSS 让内容和样式解耦,Markdown 的理念在这里同样适用
超链接能力:PPT 里的「点击跳转」功能,HTML 用
a href原生支持
更重要的是,HTML 是 Agent 唯一能「看到」的展示格式。当 Agent 需要分析一份演示文稿时,它可以渲染 HTML 并理解其视觉结构。但当它面对 PPT 时,它只能读取幻灯片序列——无法理解布局意图。
二、双重可读性:为什么人类和 Agent 需要同一种格式
2.1 格式即协议
在人类协作场景中,格式是「契约」——我用 Word 发给你,你用 Word 打开,我们心照不宣地约定了一套排版规则。在单人工作流中,这没有问题。
但当 Agent 加入协作时,问题出现了:格式必须是 人类可读 + 机器可解析 的公共语言。
Word 不是公共语言,它是 Microsoft 的私有协议。Agent 可以读取它,但需要额外的解析层,会损失精度,会遇到兼容性问题。
Markdown、CSV、HTML 是公共语言。它们是 RFC 规范的一部分,它们的语法是公开的,它们的解析器存在于每一种编程语言的标准库里。它们是格式即协议理念的最佳实践。
2.2 Agent 工作流的天然友好
考虑一个典型的 Agent 数据处理流程:
1. 读取源文档
2. 理解数据结构
3. 提取关键信息
4. 生成新文档
5. 存储结果
在这个流程中,Markdown/CSV/HTML 的优势是:
步骤 1:无需格式转换,直接解析
步骤 2:语义清晰,结构可预测
步骤 3:正则或 AST 提取都高效
步骤 4:生成成本极低,无版权问题
步骤 5:存储友好,Git/VCS 天然支持
Word/Excel/PPT 的流程是:
1. 调用 COM 接口或第三方库读取
2. 处理 OLE 对象、嵌入式字体、样式映射
3. 提取时可能丢失格式
4. 需要 Office 授权或 LibreOffice 兼容层
5. 二进制格式,版本控制噩梦
三、场景论述:从写代码到做生意
3.1 开发者场景
程序员的文档工作流早已是 Markdown 的天下:
README:GitHub 官方推荐格式
API 文档:Swagger/OpenAPI 都是 YAML/JSON(CSV 的近亲)
代码评审:diff 就是 Markdown 格式的注释
技术博客:Hexo、Hugo、VitePress 全部基于 Markdown
VS Code 内置 Markdown 预览,JetBrains 全家桶支持 Markdown,终端里 cat 就能查看内容。程序员不需要说服,他们早就做出了选择。
3.2 数据分析场景
数据分析师的核心产出是报告和数据。CSV 在这里扮演的角色:
数据导出:任何数据库都能
COPY TO 'data.csv'数据交换:Python
pandas.read_csv(),Rread.csv(),JavaScriptd3.csv()版本控制:数据变更历史,Git diff 一目了然
AI 入口:任何 LLM 都能直接分析 CSV,无需 OCR 或 PDF 解析
Excel 在数据分析中的角色正在被侵蚀。复杂公式和数据可视化留给专业 BI 工具(Metabase、Superset、Tableau),数据本身用 CSV 表达就够了。
3.3 内容创作场景
内容创作者面临的问题更复杂。他们需要排版、配图、发布。传统方案是 Word + 微信公众号编辑器,或者 Typora + 手动复制。
新方案是:
写作:Markdown(Obsidian、Typora、iA Writer)
发布:静态网站生成器(Hugo、Next.js),或者专门的 Markdown 写作平台(如 Notion、飞书文档也支持 Markdown 导入导出)
协作:通过 Git 拉取请求进行多人协作
HTML 在内容创作中的角色正在升级。现代 CMS(Content Management System)本质上都是 HTML 生成器。Markdown 经过渲染后就是 HTML,HTML 再经过样式化后就是用户看到的页面。
3.4 企业办公场景
这是变革最慢、但也最需要变革的领域。
现状是:一家 100 人的公司,每年在 Office 授权上的支出可能超过 10 万元人民币。这还没算上格式不兼容导致的沟通成本、版本混乱导致的返工成本。
AI Agent 介入企业办公的路径是清晰的:
Agent 读取邮件附件(PDF、DOCX)→ 提取信息 → 生成任务
Agent 读取数据表格 → 分析趋势 → 生成报告
Agent 读取会议纪要 → 提取待办 → 创建任务卡片
在这个链路中,每一步的效率提升都依赖于格式的开放性。DOCX 比 Markdown 慢 0.5 秒,1000 次操作就是 500 秒。CSV 比 XLSX 少一次格式转换,数据处理流水线缩短 20%。
四、生态革命:当前平台的困境与机遇
4.1 微信:不支持预览的代价
这是最讽刺的场景:一份用 Markdown 写的精美文档,发到微信群里,接收者看到的是一个纯文本消息,没有任何预览,没有格式,没有图片。
微信的文档预览机制是:
.doc/.docx:有预览.xls/.xlsx:有预览.pdf:有预览.md/.csv/.html:没有预览
这意味着什么?用户被迫使用 Word 和 Excel,因为这是微信唯一能预览的格式。
这是一个典型的锁定效应(Lock-in Effect):不是因为 Markdown 不够好,而是因为平台不支持。
但这个局面正在改变:
飞书、钉钉、Notion 已经原生支持 Markdown 预览
GitHub 的
.md文件预览体验远超 WordVS Code 的 Markdown Preview 成为事实标准
平台对格式的支持,本质上是对开放的投票。当更多平台支持 Markdown,用户的迁移成本就降低,生态就扩大。
4.2 邮件:附件格式的惯性
Email 是另一个惯性巨大的场景。发一份 .docx 附件,Outlook 可以预览,Gmail 可以预览,手机自带邮件客户端也可以预览。发一份 .md 附件?
大多数邮件客户端会把它当作纯文本显示,或者直接显示为无法识别的附件。
但这个问题有技术解法:
Markdown here 插件:将 Markdown 渲染为 HTML 邮件
邮件客户端 Markdown 扩展:Thunderbird 已经有插件支持
MIME 类型支持:添加
.md的text/markdownMIME 类型注册
邮件格式的变革不会在一夜之间发生,但它正在被 Markdown 化的工具(Notion 分享、飞书文档)所侵蚀。当你的团队开始用飞书写文档,邮件附件就变成了备份,而不是主力。
4.3 PDF:最后的堡垒
PDF 是文档格式的「终态」——它表示「我不想让你再编辑了」。但 PDF 也是格式革命的终点:当一切都 Markdown 化之后,PDF 只是「导出」选项之一。
技术已经成熟:
pandoc:Markdown → PDF(通过 LaTeX)weasyprint:Markdown + HTML + CSS → PDFmarkitdown:PDF → Markdown(反过来也可以)
PDF 不会消失,但它会从「默认格式」变成「发布格式」。
五、过渡期的挑战与机遇
5.1 格式迁移的成本
从 Word 到 Markdown 的迁移不是零成本的。主要挑战:
| 格式丢失 | ||
| 批注冲突 | ||
| 协作惯性 | ||
| 平台锁定 | .docx 格式交付 |
这些挑战是真实的,但不构成阻碍。它们是迁移成本,而非格式缺陷。
5.2 AI Native 的新工具链
新一波工具正在围绕 Markdown/CSV/HTML 构建:
写作工具:Obsidian、Logseq、Typora、iA Writer
数据工具:Airtable(CSV UI)、Notion Tables、Google Sheets(导出 CSV)
展示工具:Marp(Markdown → PPT)、reveal.js(HTML 幻灯片)、Slidev(Markdown + Vue)
协作工具:GitBook、DocuSense、Mem 都在拥抱 Markdown
这个生态正在形成飞轮效应:更多工具支持 → 更多用户使用 → 更多内容产生 → 更多工具支持。
5.3 Agent 的格式偏好
最后,让我们明确一点:AI Agent 有强烈的格式偏好。
当 OpenAI、Anthropic、Google 的 Agent 系统需要处理文档时,它们的默认输入输出格式是:
结构化数据:
json、csv文本内容:
markdown、纯文本展示内容:
html
这不是巧合。这是 AI 原生(AI Native)设计理念的体现:格式应该服务于模型的理解,而不是模型去适应格式。
当你的工作流基于 Markdown/CSV/HTML,你就是在为 AI 优化工作流。你不需要额外的「AI 适配层」,你的内容已经是 AI Ready。
普通人行动指南:如何迈出第一步
读到这里,你可能会想:「道理我都懂,但我明天上班还是要用 Word。」没错,没有人要求你一夜之间扔掉 Office。但你可以从一个很小的改变开始——选择一个 Markdown 笔记软件,用它来管理你的第二大脑。
第一步:选一个 Markdown 笔记软件,从今天开始写
不要纠结哪个最好,选一个开始用就好。如果你非要一个推荐,我选 Obsidian。
为什么是 Obsidian?
本地存储:你的笔记就是文件夹里的
.md文件,不存在任何厂商锁定。今天不想用了,拖到 VS Code 里照样能读双向链接:用
[[笔记名]]就能把知识串联起来,这不是 Word 里的「超链接」,而是真正的知识图谱插件生态:1500+ 社区插件,想要什么功能几乎都能找到,尤其Claudian插件,嵌入式整合进Obsidian,给你的知识库加上最强大脑
AI 原生友好:Obsidian Cli,Obsidian Skills都已完善,Agent无缝使用
不只是 Obsidian,Typora(所见即所得)、Logseq(大纲笔记)、iA Writer(极简写作)都是优秀的选择。关键不是选哪个,而是开始用 Markdown 写东西。
把你的会议纪要、读书笔记、项目文档、甚至日记,都放进这个软件里。一个月后你会发现:你不再需要打开 Word 了。
第二步:让 Agent 帮你完成格式转换
你用 Markdown 写好内容之后,剩下的工作交给 AI Agent。
Markdown → CSV:你在笔记里整理了一张产品对比表,Agent 可以瞬间把它转成 CSV,导入到任何数据分析工具里。
Markdown → HTML:你写了一篇文章,Agent 渲染成带样式的 HTML 页面,发到微信公众号、公司官网、或者做成在线幻灯片(reveal.js、Slidev 都是基于 HTML 的演示工具)。
Markdown → PDF / Word:需要正式交付时,一行命令就能转换。Pandoc 是这个领域的瑞士军刀——Markdown 进,Word / PDF / HTML / EPUB 出。
反过来也行:收到一份 Word 文档,让 Agent 转成 Markdown 存进你的笔记库。markitdown(微软出品)和 Unstructured 都能帮你把 PDF、Word 还原为 Markdown。
核心逻辑是:Markdown 作为你的「源文件」格式,其他格式只是「导出」选项。就像程序员用源代码生成产品,你用 Markdown 生成各种文档。
第三步:建立你的 AI-Ready 工作流
当你习惯了用 Markdown 写作,整个工作流会变得异常顺畅:
输入(任何格式)→ Agent 转为 Markdown → 你的笔记库(知识沉淀)
↓
输出(按需生成)← Agent 转为目标格式 ← Markdown 源文件
需要发邮件?Agent 从笔记提取内容,生成 HTML 邮件
需要做汇报?Agent 把 Markdown 渲染成网页幻灯片
需要数据表?Agent 解析笔记中的表格,导出为 CSV
需要 Word?Agent 一键转换,格式保留
这不是未来,这是现在就能做的事。你唯一需要改变的习惯是:从今天开始,用 Markdown 作为你的第一语言。
起步资源
| 笔记软件 | ||
| 轻量编辑 | ||
| 格式转换 | ||
| Word 转 Markdown | ||
| HTML 幻灯片 | ||
| 数据交换 | ||
| AI Agent |
结语
Word/Excel/PowerPoint 统治了 30 年的办公市场,但这 30 年也是 PC 时代向互联网时代过渡的 30 年。在那个人类独占工作流的时代,专有格式的锁定效应是保护,是壁垒,是商业护城河。
但现在,Agent 来了。它们不是 Word 的用户,它们不购买 Office 授权,它们不需要理解 .docx 的 OLE 规范。它们只需要:结构化的、可解析的、语义清晰的文本。
Markdown、CSV、HTML 正是为此而生。
这场革命不会一夜发生。Office 三件套还会存在很久,在某些场景下甚至会继续是首选。但趋势是清晰的——未来的三件套,属于那些愿意为开放付出代价的人,属于那些相信格式应该服务于内容而非软件的人。
你准备好了吗?
夜雨聆风