Office 统治了 30 年,AI 说:该换了

核心观点

这不是技术迭代，这是信息载体的人类学转向。在 AI Agent 全面介入工作流之前，我们需要重新思考一个根本问题：什么样的文档格式，能同时被人类和机器高效地阅读、理解和编辑？

答案是 Markdown、CSV、HTML。

一、为什么是这三兄弟

1.1 Markdown：文本的原子化结构

Markdown 的本质是一个轻量级标记语言。它用极简的符号（#、*、-、>）构建层级结构，用纯文本实现了格式化。这让它具备了几个关键特性：

特性	对人类	对 Agent
纯文本存储	任何编辑器可打开，无需购买授权	直接解析 AST，无需 OLE 解析或 COM 调用
版本友好	diff 可视化，Git 历史清晰	语义 diff，而非字节级 diff
生态丰富	Obsidian、Typora、VS Code 百花齐放	LangChain、 LlamaIndex 原生支持
链接能力	WikiLink 双向互联	关系图谱的天然输入

Word 的问题在于它是一个二进制容器。.docx 本质上是一个 ZIP 包，里面塞满了 XML 和资源文件。当你尝试让 Agent 解析一份 Word 文档时，你实际上在要求它理解 Microsoft 的私有规范。而 Markdown？它就是文本，任何大语言模型从第一天就能理解它。

1.2 CSV：数据的本真表达

CSV（Comma-Separated Values）看似原始，但它遵循一个核心哲学：数据的结构应该由数据本身决定，而不是由软件决定。

Excel 是一个应用软件，它有自己的数据类型系统（日期、数字、货币、百分比）、格式化规则、公式引擎、图表引擎。当 Agent 要操作 Excel 时，它需要理解这一整套上下文。

CSV 不同。它只有两个概念：行和列，用分隔符（通常是逗号）连接。每一行是一条记录，每一列是一个字段。这是一种图灵完备的数据表达方式——任何关系型数据库、任何数据分析工具、任何 AI 模型都能无歧义地处理它。

name,age,city,score
Alice,28,Beijing,92
Bob,35,Shanghai,88
Charlie,31,Shenzhen,95

这四行文本，任何 Agent 都能在 0.1 秒内理解其结构。

1.3 HTML：结构化展示的标准答案

PPT 的核心功能是展示——把信息以视觉化、结构化的方式呈现给观众。而 HTML 是 Web 的展示标准，它解决的问题和 PPT 一样，但开放得多：

语义化结构：header、section、article、figure 这些标签天然就是演示文稿的「标题页」「章节」「内容」「图表」
响应式布局：一份 HTML 可以适配手机、平板、投屏，PPT 需要为不同屏幕准备不同设置
样式分离：CSS 让内容和样式解耦，Markdown 的理念在这里同样适用
超链接能力：PPT 里的「点击跳转」功能，HTML 用 a href 原生支持

更重要的是，HTML 是 Agent 唯一能「看到」的展示格式。当 Agent 需要分析一份演示文稿时，它可以渲染 HTML 并理解其视觉结构。但当它面对 PPT 时，它只能读取幻灯片序列——无法理解布局意图。

二、双重可读性：为什么人类和 Agent 需要同一种格式

2.1 格式即协议

在人类协作场景中，格式是「契约」——我用 Word 发给你，你用 Word 打开，我们心照不宣地约定了一套排版规则。在单人工作流中，这没有问题。

但当 Agent 加入协作时，问题出现了：格式必须是 人类可读 + 机器可解析 的公共语言。

Word 不是公共语言，它是 Microsoft 的私有协议。Agent 可以读取它，但需要额外的解析层，会损失精度，会遇到兼容性问题。

Markdown、CSV、HTML 是公共语言。它们是 RFC 规范的一部分，它们的语法是公开的，它们的解析器存在于每一种编程语言的标准库里。它们是格式即协议理念的最佳实践。

2.2 Agent 工作流的天然友好

考虑一个典型的 Agent 数据处理流程：

1. 读取源文档
2. 理解数据结构
3. 提取关键信息
4. 生成新文档
5. 存储结果

在这个流程中，Markdown/CSV/HTML 的优势是：

步骤 1：无需格式转换，直接解析
步骤 2：语义清晰，结构可预测
步骤 3：正则或 AST 提取都高效
步骤 4：生成成本极低，无版权问题
步骤 5：存储友好，Git/VCS 天然支持

Word/Excel/PPT 的流程是：

1. 调用 COM 接口或第三方库读取
2. 处理 OLE 对象、嵌入式字体、样式映射
3. 提取时可能丢失格式
4. 需要 Office 授权或 LibreOffice 兼容层
5. 二进制格式，版本控制噩梦

三、场景论述：从写代码到做生意

3.1 开发者场景

程序员的文档工作流早已是 Markdown 的天下：

README：GitHub 官方推荐格式
API 文档：Swagger/OpenAPI 都是 YAML/JSON（CSV 的近亲）
代码评审：diff 就是 Markdown 格式的注释
技术博客：Hexo、Hugo、VitePress 全部基于 Markdown

VS Code 内置 Markdown 预览，JetBrains 全家桶支持 Markdown，终端里 cat 就能查看内容。程序员不需要说服，他们早就做出了选择。

3.2 数据分析场景

数据分析师的核心产出是报告和数据。CSV 在这里扮演的角色：

数据导出：任何数据库都能 COPY TO 'data.csv'
数据交换：Python pandas.read_csv()，R read.csv()，JavaScript d3.csv()
版本控制：数据变更历史，Git diff 一目了然
AI 入口：任何 LLM 都能直接分析 CSV，无需 OCR 或 PDF 解析

Excel 在数据分析中的角色正在被侵蚀。复杂公式和数据可视化留给专业 BI 工具（Metabase、Superset、Tableau），数据本身用 CSV 表达就够了。

3.3 内容创作场景

内容创作者面临的问题更复杂。他们需要排版、配图、发布。传统方案是 Word + 微信公众号编辑器，或者 Typora + 手动复制。

新方案是：

写作：Markdown（Obsidian、Typora、iA Writer）
发布：静态网站生成器（Hugo、Next.js），或者专门的 Markdown 写作平台（如 Notion、飞书文档也支持 Markdown 导入导出）
协作：通过 Git 拉取请求进行多人协作

HTML 在内容创作中的角色正在升级。现代 CMS（Content Management System）本质上都是 HTML 生成器。Markdown 经过渲染后就是 HTML，HTML 再经过样式化后就是用户看到的页面。

3.4 企业办公场景

这是变革最慢、但也最需要变革的领域。

现状是：一家 100 人的公司，每年在 Office 授权上的支出可能超过 10 万元人民币。这还没算上格式不兼容导致的沟通成本、版本混乱导致的返工成本。

AI Agent 介入企业办公的路径是清晰的：

Agent 读取邮件附件（PDF、DOCX）→ 提取信息 → 生成任务
Agent 读取数据表格 → 分析趋势 → 生成报告
Agent 读取会议纪要 → 提取待办 → 创建任务卡片

在这个链路中，每一步的效率提升都依赖于格式的开放性。DOCX 比 Markdown 慢 0.5 秒，1000 次操作就是 500 秒。CSV 比 XLSX 少一次格式转换，数据处理流水线缩短 20%。

四、生态革命：当前平台的困境与机遇

4.1 微信：不支持预览的代价

这是最讽刺的场景：一份用 Markdown 写的精美文档，发到微信群里，接收者看到的是一个纯文本消息，没有任何预览，没有格式，没有图片。

微信的文档预览机制是：

.doc / .docx：有预览
.xls / .xlsx：有预览
.pdf：有预览
.md / .csv / .html：没有预览

这意味着什么？用户被迫使用 Word 和 Excel，因为这是微信唯一能预览的格式。

这是一个典型的锁定效应（Lock-in Effect）：不是因为 Markdown 不够好，而是因为平台不支持。

但这个局面正在改变：

飞书、钉钉、Notion 已经原生支持 Markdown 预览
GitHub 的 .md 文件预览体验远超 Word
VS Code 的 Markdown Preview 成为事实标准

平台对格式的支持，本质上是对开放的投票。当更多平台支持 Markdown，用户的迁移成本就降低，生态就扩大。

4.2 邮件：附件格式的惯性

Email 是另一个惯性巨大的场景。发一份 .docx 附件，Outlook 可以预览，Gmail 可以预览，手机自带邮件客户端也可以预览。发一份 .md 附件？

大多数邮件客户端会把它当作纯文本显示，或者直接显示为无法识别的附件。

但这个问题有技术解法：

Markdown here 插件：将 Markdown 渲染为 HTML 邮件
邮件客户端 Markdown 扩展：Thunderbird 已经有插件支持
MIME 类型支持：添加 .md 的 text/markdown MIME 类型注册

邮件格式的变革不会在一夜之间发生，但它正在被 Markdown 化的工具（Notion 分享、飞书文档）所侵蚀。当你的团队开始用飞书写文档，邮件附件就变成了备份，而不是主力。

4.3 PDF：最后的堡垒

PDF 是文档格式的「终态」——它表示「我不想让你再编辑了」。但 PDF 也是格式革命的终点：当一切都 Markdown 化之后，PDF 只是「导出」选项之一。

技术已经成熟：

pandoc：Markdown → PDF（通过 LaTeX）
weasyprint：Markdown + HTML + CSS → PDF
markitdown：PDF → Markdown（反过来也可以）

PDF 不会消失，但它会从「默认格式」变成「发布格式」。

五、过渡期的挑战与机遇

5.1 格式迁移的成本

从 Word 到 Markdown 的迁移不是零成本的。主要挑战：

挑战	描述	解法
格式丢失	Word 的复杂样式（页眉页脚、域代码、水印）无法完全转换	选择性保留，核心内容优先
批注冲突	Word 的修订模式（Track Changes）和 Markdown 的评论体系不同	使用 Git PR 或专门的评论工具
协作惯性	同事坚持用 Word，你被迫妥协	从非核心文档开始，逐步推广
平台锁定	客户要求 `.docx` 格式交付	保持双格式输出能力

这些挑战是真实的，但不构成阻碍。它们是迁移成本，而非格式缺陷。

5.2 AI Native 的新工具链

新一波工具正在围绕 Markdown/CSV/HTML 构建：

写作工具：Obsidian、Logseq、Typora、iA Writer
数据工具：Airtable（CSV UI）、Notion Tables、Google Sheets（导出 CSV）
展示工具：Marp（Markdown → PPT）、reveal.js（HTML 幻灯片）、Slidev（Markdown + Vue）
协作工具：GitBook、DocuSense、Mem 都在拥抱 Markdown

这个生态正在形成飞轮效应：更多工具支持 → 更多用户使用 → 更多内容产生 → 更多工具支持。

5.3 Agent 的格式偏好

最后，让我们明确一点：AI Agent 有强烈的格式偏好。

当 OpenAI、Anthropic、Google 的 Agent 系统需要处理文档时，它们的默认输入输出格式是：

结构化数据：json、csv
文本内容：markdown、纯文本
展示内容：html

这不是巧合。这是 AI 原生（AI Native）设计理念的体现：格式应该服务于模型的理解，而不是模型去适应格式。

当你的工作流基于 Markdown/CSV/HTML，你就是在为 AI 优化工作流。你不需要额外的「AI 适配层」，你的内容已经是 AI Ready。

普通人行动指南：如何迈出第一步

读到这里，你可能会想：「道理我都懂，但我明天上班还是要用 Word。」没错，没有人要求你一夜之间扔掉 Office。但你可以从一个很小的改变开始——选择一个 Markdown 笔记软件，用它来管理你的第二大脑。

第一步：选一个 Markdown 笔记软件，从今天开始写

不要纠结哪个最好，选一个开始用就好。如果你非要一个推荐，我选 Obsidian。

为什么是 Obsidian？

本地存储：你的笔记就是文件夹里的 .md 文件，不存在任何厂商锁定。今天不想用了，拖到 VS Code 里照样能读
双向链接：用 [[笔记名]] 就能把知识串联起来，这不是 Word 里的「超链接」，而是真正的知识图谱
插件生态：1500+ 社区插件，想要什么功能几乎都能找到，尤其Claudian插件，嵌入式整合进Obsidian，给你的知识库加上最强大脑
AI 原生友好：Obsidian Cli，Obsidian Skills都已完善，Agent无缝使用

不只是 Obsidian，Typora（所见即所得）、Logseq（大纲笔记）、iA Writer（极简写作）都是优秀的选择。关键不是选哪个，而是开始用 Markdown 写东西。

把你的会议纪要、读书笔记、项目文档、甚至日记，都放进这个软件里。一个月后你会发现：你不再需要打开 Word 了。

第二步：让 Agent 帮你完成格式转换

你用 Markdown 写好内容之后，剩下的工作交给 AI Agent。

Markdown → CSV：你在笔记里整理了一张产品对比表，Agent 可以瞬间把它转成 CSV，导入到任何数据分析工具里。

Markdown → HTML：你写了一篇文章，Agent 渲染成带样式的 HTML 页面，发到微信公众号、公司官网、或者做成在线幻灯片（reveal.js、Slidev 都是基于 HTML 的演示工具）。

Markdown → PDF / Word：需要正式交付时，一行命令就能转换。Pandoc 是这个领域的瑞士军刀——Markdown 进，Word / PDF / HTML / EPUB 出。

反过来也行：收到一份 Word 文档，让 Agent 转成 Markdown 存进你的笔记库。markitdown（微软出品）和 Unstructured 都能帮你把 PDF、Word 还原为 Markdown。

核心逻辑是：Markdown 作为你的「源文件」格式，其他格式只是「导出」选项。就像程序员用源代码生成产品，你用 Markdown 生成各种文档。

第三步：建立你的 AI-Ready 工作流

当你习惯了用 Markdown 写作，整个工作流会变得异常顺畅：

输入（任何格式）→ Agent 转为 Markdown → 你的笔记库（知识沉淀）
                                            ↓
输出（按需生成）← Agent 转为目标格式 ← Markdown 源文件

需要发邮件？Agent 从笔记提取内容，生成 HTML 邮件
需要做汇报？Agent 把 Markdown 渲染成网页幻灯片
需要数据表？Agent 解析笔记中的表格，导出为 CSV
需要 Word？Agent 一键转换，格式保留

这不是未来，这是现在就能做的事。你唯一需要改变的习惯是：从今天开始，用 Markdown 作为你的第一语言。

起步资源

类别	推荐工具	一句话描述
笔记软件	Obsidian	本地优先的 Markdown 知识库，插件生态强大
轻量编辑	Typora	所见即所得，适合长文写作
格式转换	Pandoc	万能格式转换器，Markdown ↔ Word/PDF/HTML
Word 转 Markdown	markitdown	微软出品，Word/PDF 还原为 Markdown
HTML 幻灯片	Slidev	用 Markdown 写演示文稿，开发者友好
数据交换	CSV 格式	无需额外工具，任何表格数据用 CSV 存储和交换
AI Agent	Claude / ChatGPT / Copilot	直接读写 Markdown，帮你完成格式转换和内容生成

结语

Word/Excel/PowerPoint 统治了 30 年的办公市场，但这 30 年也是 PC 时代向互联网时代过渡的 30 年。在那个人类独占工作流的时代，专有格式的锁定效应是保护，是壁垒，是商业护城河。

但现在，Agent 来了。它们不是 Word 的用户，它们不购买 Office 授权，它们不需要理解 .docx 的 OLE 规范。它们只需要：结构化的、可解析的、语义清晰的文本。

Markdown、CSV、HTML 正是为此而生。

这场革命不会一夜发生。Office 三件套还会存在很久，在某些场景下甚至会继续是首选。但趋势是清晰的——未来的三件套，属于那些愿意为开放付出代价的人，属于那些相信格式应该服务于内容而非软件的人。