国企人苦公文格式久矣:我用 AI-Skills 做了个自动核对助手
一份公文写完,最让人头疼的往往不是正文。
而是标题是不是居中,字体是不是对,正文行距是不是 28 磅,附件后面有没有多打一个句号,落款和日期是不是该靠右,页码是不是规范,甚至一个小小的年份连接号到底应该怎么写。
很多人都有过类似经历:内容已经改了三轮,逻辑也顺了,最后却卡在格式上。文件来回退,时间一点点耗掉,起草人、审核人、综合岗都在同一份 Word 里反复确认细节。
尤其在国有企业,公文不是“写清楚就行”。它有制度属性、流程属性和组织形象属性,格式要求之严格,有时真可以说是无以复加。
标题差一号字体,正文少了固定行距,附件说明多了一个标点,落款日期没有对齐,页码样式不规范,都可能让一份本来内容成熟的文件重新返工。很多员工不是不重视公文,而是苦公文格式久矣:规则太细、场景太多、模板太杂,靠人工记忆和肉眼检查,难免疲惫。
于是我们做了一个小工具:公文格式智能核对与规范化助手。
它不是替人写公文,也不是替代审批判断。它要解决的是一个更具体、更高频的问题:
让 AI 按照明确的公文格式规则,自动检查 Word 文档,自动修正常见格式问题,并生成一份可追溯的核对报告。
痛点:格式问题很小,但很耗人
公文格式有一个特点:规则本身并不神秘,但细节非常多。
比如:
- 标题字体、字号、是否加粗、是否居中
- 正文字体、行距、首行缩进
- 一级、二级、三级标题的字体差异
- 附件说明的写法
- 落款和成文日期的位置
- 页码样式
- 标点符号、书名号、年份连接号等细节
这些问题单独看都不大,但叠在一起,就会变成一种很典型的“低价值高消耗”工作。
更麻烦的是,格式问题通常发生在流程末端。越到后面才发现,返工成本越高。
对国有企业来说,这类返工还不只是个人效率问题。它会占用起草、复核、归口、审批等多个环节的时间,让本来应该用于把关内容质量、政策口径和风险边界的精力,被消耗在大量重复性的格式核查里。
方案:把经验变成规则库,把规则交给 AI-Skills
这个助手的核心不是让大模型“凭感觉判断”,而是把公文格式要求沉淀成可执行的规则库。
规则库里记录了页面、字体、段落、标题层级、附件、落款、日期、页码等要求。AI-Skills 则负责把这些规则变成一个稳定的处理流程。
整体逻辑可以概括为四步:
- 读取规则库
- 解析 Word 文档结构
- 识别文档语义角色
- 自动排版并生成核对报告
这里的关键点在于,助手不是只看一段复制出来的文字,而是直接读取 Word 文档结构。它会识别每个段落的字体、字号、对齐方式、缩进、行距、页边距等信息,再判断这个段落更可能是标题、主送机关、正文、附件说明、落款还是成文日期。
AI-Skills 做了什么
我们把这个能力封装成一个 AI-Skill。
对使用者来说,操作很简单:
上传一个 Word 文件,告诉助手“帮我整理成标准公文格式”。助手处理完成后,会返回两个文件:
- 标准化后的 Word 文档
- 格式核对报告
标准化文档用于继续流转或送审,核对报告用于查看本次处理了哪些问题、哪些地方还需要人工确认。
这类设计有一个好处:AI 不再只是聊天窗口里的建议,而是变成了一个可重复调用的办公技能。
规则库不是提示词,而是可维护的标准
很多 AI 办公工具容易遇到一个问题:今天回答对了,明天换个说法又不稳定。
所以这个项目里,我们把格式要求拆成结构化规则,而不是只写成一段提示词。
规则库中包括:
| 类型 | 示例 |
|---|---|
| 页面规则 | A4 页面、页边距、版心要求 |
| 字体规则 | 标题、正文、各级标题字体字号 |
| 段落规则 | 固定行距、首行缩进、段前段后 |
| 语义规则 | 标题、主送机关、附件、落款、日期识别 |
| 自动修正规则 | 常见标点、序号、年份连接号、附件格式 |
| 人工复核项 | 文种混用、行文关系、内容口径、用印效果 |
比如,助手可以自动识别并处理这些问题:
- 标题末尾多了标点
1、这类层级序号不规范- 多个书名号之间误加顿号
2026-2027年中的连接号不规范附件1:应调整为规范附件说明写法- 附件名称末尾多了句号或分号
- 成文日期格式错误
- 落款和成文日期未按规则对齐
同时,对于不适合机器直接判断的事项,助手不会“自作主张”,而是放进核对报告中提醒人工复核。
为什么要保留核对报告
自动排版只是第一步,更重要的是让处理过程可解释。
核对报告会列出:
- 识别出的文档结构
- 每个段落对应的角色
- 自动修正了哪些格式问题
- 哪些问题需要人工复核
- 输出文件名称和处理时间
这让使用者能清楚知道:工具到底做了什么,没有做什么。
对于公文这种严肃文本,这一点尤其重要。AI 可以提升效率,但责任边界必须清晰。
演示:一份错误样例能识别出几十项提示
为了测试助手效果,我们准备了一份故意带有多处格式错误的请示类文档。
这份样例里包含页面设置、标题字体、正文行距、附件说明、成文日期、落款对齐、页码样式等多类问题。
上传后,助手会自动生成标准化文档,同时输出核对报告。报告会逐条展示处理项,例如:
- 页面设置已调整为标准版式
- 标题已按规定字体字号居中
- 正文已统一为指定字体和固定行距
- 附件说明已修正
- 成文日期已规范化
- 落款和日期已右对齐
- 部分文种、行文关系和内容口径提示人工复核
这种演示非常直观:原来需要人工逐项检查的问题,现在可以先由工具完成第一轮筛查和修正。
它适合解决什么,不适合解决什么
这个助手适合处理高频、规则明确、可重复的格式类工作。
适合:
- 公文初稿格式整理
- 制度类 Word 文档格式核对
- 附件说明、页码、标题层级等常见问题检查
- 发文前的格式自查
- 新员工熟悉公文格式要求
不适合:
- 替代公文内容审核
- 替代行文关系判断
- 替代审批责任
- 替代涉密文件的安全审查
- 替代最终用印和版式确认
简单说,它解决的是“格式是不是规范”,不是“这份文件该不该发”。
部署方式:让工具出现在日常入口里
为了让它真正被使用,工具不应该藏在复杂系统里。
更理想的方式,是把它接入日常办公入口。用户在对话窗口上传 Word 文件,助手处理后直接返回标准化文档和核对报告。
后台可以采用“工具插件 + 文件上传/下载”的模式:
- 用户上传
.docx或.doc文件 - 平台把文件传给公文格式 AI-Skill
- Skill 调用本地规则库和处理脚本
- 输出标准化 Word 文档和核对报告
- 平台把结果文件返回给用户
如果遇到老旧 .doc 文件,也可以先转换成 .docx 再处理。
附:这个项目的 AI-Skills 长什么样
为了让这个能力能被复用,我们把它整理成一个可发布、可部署、可扩展的 AI-Skills 项目。
公开版项目结构大致如下:
gongwen-format-skill/├── README.md├── LICENSE├── .gitignore└── gongwen-format/ ├── SKILL.md ├── agents/openai.yaml ├── references/ │ ├── gongwen_rules.json │ └── file_channel_tool_manifest.json ├── scripts/ │ ├── format_gongwen_docx.py │ ├── file_channel_cli.py │ ├── check_fonts.py │ └── install_fonts.sh ├── assets/fonts/ └── requirements.txt
其中最核心的是三部分:
| 模块 | 作用 |
|---|---|
SKILL.md | 告诉 AI 什么时候调用这个技能、按什么流程处理 |
gongwen_rules.json | 存放公文格式规则,包括页面、字体、段落、标题、附件、落款、日期、页码等 |
format_gongwen_docx.py | 负责解析 Word 结构、识别段落角色、自动排版并生成核对报告 |
这个 Skill 的触发方式也很直观。用户只要上传 Word 文件,并提出类似请求:
帮我把这个 Word 整理成标准公文格式,并生成格式核对报告。
AI 就会调用 gongwen-format,按规则库处理文件,最后返回两类结果:
- 标准公文格式 Word
- 格式核对报告 Word
如果要接入文件通道,可以使用 file_channel_cli.py:
python gongwen-format/scripts/file_channel_cli.py --input path/to/input.docx --output-dir output
如果要直接在本地测试,可以使用核心脚本:
python gongwen-format/scripts/format_gongwen_docx.py path/to/input.docx -o output
这也是 AI-Skills 的价值所在:不是把所有规则都塞进一次对话提示词里,而是把可复用的流程、规则库和确定性脚本封装起来。AI 负责理解用户意图、调用技能、解释报告;规则库和脚本负责稳定执行。
特别说明一下:公开版项目不包含任何单位名称、内部制度全文、人员信息、系统地址,也不包含需授权分发的字体文件。字体可由使用单位在本地合法安装,规则库也可以按本单位制度进一步扩展。
安全边界:能脱敏的脱敏,能本地的本地
公文处理天然涉及信息安全。
因此,这类工具在设计时应坚持几个原则:
- 不在公开环境暴露内部制度全文
- 不在文章、演示和截图中出现企业名称、人员姓名、系统地址
- 不处理涉密文件
- 规则库和脚本尽量部署在内网或受控环境
- 输出报告只记录格式处理过程,不扩大内容传播范围
AI 办公应用越贴近真实业务,越要把安全边界写在前面。
真正的价值:不是替人,而是让人少被格式消耗
这个项目最打动人的地方,不是技术多复杂,而是它击中了一个很日常的办公痛点。
公文格式当然重要,但人的精力更应该放在内容质量、政策口径、审批逻辑和业务判断上。
把格式规则交给规则库,把重复核对交给 AI-Skills,把处理过程写进核对报告。
这样一来,公文起草人不必反复翻格式要求,审核人也能更快定位问题,组织内部的公文质量还能逐步沉淀成一套可复用、可维护、可推广的能力。
也许 AI 办公最好的样子,并不是一上来就颠覆所有流程。
而是先从这些烦人、细碎、重复、但确实影响效率的小事开始。
从此,再见,烦人的公文格式。
你好,规则清晰、过程可查、交付稳定的智能办公助手。
开源:
https://github.com/btcgenius/gongwen-format
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见
夜雨聆风