Office文档格式的演化历史
DOC格式(1983-2007):
微软Word 1.0(1983年)首次引入.doc作为默认文档格式,采用二进制存储,将文字、格式、图片等信息打包为非结构化的二进制流。这种格式的优势是文件体积小、格式兼容性好(Word内部处理高效),但封闭性是其致命缺陷——文件结构不公开,第三方开发者难以解析,导致跨软件协作(如用WPS打开Word文档)时常出现格式错乱。
DOCX/XLSX/PPTX格式(2007+):
2007年,微软推出Office Open XML(OOXML)格式,以XML(可扩展标记语言)为核心。XML是国际标准,文件结构公开,第三方开发者可通过解析XML实现文档的自定义处理。
OOXML格式的本质是ZIP压缩包,内部包含多个结构化XML文件(如document.xml存储内容、styles.xml存储样式、media目录存储媒体文件)和关系描述文件(_rels目录定义文件关联)。
夜雨聆风
