AI 帮你生成的 Word 和 Excel,为啥打开总是格式全乱?MiniMax 开源了解法
你有没有遇到过这种崩溃时刻——
让 AI 帮你生成一份销售报表,Excel 打开之后,所有公式全变成了硬编码的数字,一个能动的格都没有;
或者请 AI 改一个 PPT 模板,结果字体、间距、配色全乱了,排版比自己动手还难看;
再或者,让它输出一份 Word 合同,多级目录消失了,嵌套表格直接崩掉。
这不是 AI 不够聪明——是工具层的问题。绝大多数 AI 处理 Office 文档时,底层用的都是功能有限的第三方库,碰到复杂格式就悄悄丢掉,你根本发现不了,直到打开文件的那一刻。
上个月,MiniMax(稀宇科技)开源了一套专门解决这个问题的框架——MiniMax Office Skills。7800+ Stars,MIT 协议,完全免费。
它到底解决了什么问题?
一句话:让 AI 生成的 Word、Excel、PPT、PDF 文件,真正能直接交付,不是 Demo,是成品。
这套工具包含四个核心组件,每一个都针对各自格式的痛点做了底层重构。
Word:换掉那个坑了无数人的 python-docx
你可能没听说过 python-docx,但它是目前最主流的 Python Word 处理库,几乎所有 AI 写 Word 的场景都在用它。
问题是,它对复杂格式的支持很残缺:嵌套表格容易乱、多级目录不稳定、页眉页脚控制有限、修订追踪功能几乎不存在。
MiniMax 的做法是直接换掉它——改用微软官方维护的 .NET OpenXML SDK。这是微软自己用来处理 Word 文件的底层库,对文件结构的控制能力完全不同。
结果就是:生成出来的 Word,嵌套表格正常、多级目录不乱、页眉页脚可控,修订追踪也能保留。能直接交付的文件,才算真的能用。
Excel:公式不能死,数据透视表不能丢
AI 生成 Excel 最常见的问题,就是公式变死数字。原因很简单——openpyxl 这类库在读写 xlsx 文件时,很容易把公式结果固化成静态值,数据透视表、迷你图、VBA 宏也经常在读写过程中悄悄消失。
MiniMax 的解法是:直接在 XML 层操作文件结构。
.xlsx 文件本质上是一个压缩包,里面全是 XML。他们选择直接解压、修改特定 XML 节点、再重新打包,完全绕过第三方库可能带来的格式损失。
这样处理之后,公式还是公式,数据透视表还是数据透视表,交出去的表格跟自己手做的一样能用。
PDF:封面好看,正文稳定,两件事一起做到
生成 PDF 有两个矛盾的需求:封面要有设计感,需要渐变、自定义字体这些复杂视觉效果;正文要稳定,需要精确的段落控制和分页逻辑。一个引擎很难两全。
MiniMax 采用了双引擎方案:
-
封面:HTML + CSS 设计,Playwright 渲染成 PDF——渐变、阴影、自定义字体都能做; -
正文:ReportLab 排版——段落流控制精准,分页不会乱跑。
两部分最后合并成完整文档。15 种封面风格可选,拿出去直接像样子。
PPT:不是随机排版,是有规律的视觉系统
AI 做 PPT 另一个常见问题,是每页都像出自不同人之手——字体大一页小一页,间距忽宽忽窄,配色前后不一。
MiniMax 的做法是预定义了一套视觉参数系统,把封面、目录、章节分割、内容页、总结页五类页面的字体、间距、圆角、阴影全部锁成统一配方。生成时直接套参数,不会出现风格漂移。
底层用 PptxGenJS 生成新 PPT;编辑已有文件时则直接解压修改 XML,原始格式完整保留。
还有一个细节:它会自己修错
除了工具链本身,MiniMax 还内置了一套自进化评测机制——Execute → Evaluate → Fix 循环。
每次 AI 生成文档之后,系统会自动跑一遍结构检查:公式是否保持动态?目录结构是否完整?样式有没有在读写中被破坏?
检查不过的案例,会自动沉淀成修复样本,进入下一轮迭代。这套工具不是静态代码,而是会在实际使用中越跑越稳的系统。
怎么上手?
项目地址:github.com/MiniMax-AI/skills,MIT 协议,7800+ Stars。
四个核心组件:
| 组件 | 功能 |
|---|---|
minimax-docx |
Word 文档创建与编辑 |
minimax-xlsx |
Excel 表格处理,公式完整保留 |
minimax-pdf |
PDF 生成,15 种封面风格 |
pptx-generator |
PPT 创建与编辑 |
支持接入 Cursor、Codex 等主流 AI 编程工具,也可以单独调用各组件 API。如果你在用 AI 处理日常办公文档,这套东西值得试一下。
写在最后
AI 写文档这件事,卡在格式能不能保住这个问题上,已经太久了。
MiniMax 这次开源的,不是一个新的 AI 模型,也不是一个新的应用——是一套让 AI 真正能交付办公文档的底层工具。
技术细节公开,代码开源,可以直接集成进自己的工作流里。
对普通办公用户来说,它可能暂时还没有一键可用的界面;但对有一定技术基础的人来说,这是目前解决 AI 文档生成质量问题最彻底的开源方案。
项目地址:github.com/MiniMax-AI/skills
许可协议:MIT(可商用)
Stars:7800+(2026年3月)
夜雨聆风