word一键自动排版软件最新教程,已迭代升级至5.1版本
长文档排版是个又脏又累的活,文档内结构相对简单的排版(比如公文,简单段落标题排版等)目前有一些开源软件,能够应对,也有一些开源Skill,实现一部分排版需求;wps的内置AI简单一键美化;还有排无忧等word插件排版工具等。相对来说前三种目前都只能满足简单的需求,无法处理有很多自定义样式的文档,排无忧这类插件我没用过,但是他内容很多,需要研究用法,用多了还好,但终究是插件,只能处理单个文档,无法批量处理。
word的排版,对于很多特别场景主要是:文档内有交叉引用、标签、各种域、列表等,这些元素很多朋友不知道他们是什么,也很少用,前面提到的那些工具都没有很好的解决办法,AI Agent的Skill也处理不到。排无忧没用过,不知道是否能处理。在标书、学位论文中,常常有很多这些元素。AI处理成本也不低,能使用自动化程序解决的,没必要花钱烧那个token。
我写这个软件即是为解决上面的问题,并实现低成本、本地化、绝不触碰你个人数据完全离线的安全方式,也是解决AI干不了的活,还能做到批量处理,也能够跨平台使用,但是目前我只在win10、win11系统下封装,未做OS和Liunx系统封装,Linux封装的话,顶多会在Ubuntu系统下封装一个版本。目前只兼容win10、win11,近期可能会增加Ubuntu24系统。
该软件程序解决了大部分技术难点,是我个人在编写维护,并会做长期维护,已迭代升级到5.1版本,升级了发布了5个大版本,优化调整300多次,测试文档近千次,解决了处理很多细节。有朋友用该软件在接单排版论文,基本能够解决正文部分的排版(图片、表格下面的注释暂无法处理)。但论文专用排版软件,我未公开,关于论文排版,大部分学位论文格式不统一,设置存在不小的难度,实现的技术思路并不相同,是另外一套处理方法。
一、预处理模块
暂时有12个部分,近期会再增加图表对象的大纲级别清除,恢复为正文级别功能;清除所有非列表段落的大纲级别;清除所有无序列表段落的大纲级别;使他们能够恢复为正常的段落,而不污染目录;使大纲干干净净,能够清爽的生成目录和显示正确的大纲。很多朋友对这个貌似没什么概念,文档内总会有一堆不该在大纲和目录内现实的文字。
另外列表在word内是个特殊的存在,word默认开启“自动项目符号列表”和“自动编号列表”,打上编号,按下空格或者回车,编号会自动续编,自动转换为列表,大部分朋友不会去管他,只管继续写文档,或者手动删掉了某个序号,又改为手动输入,导致自动编号断裂,给在后续文档内各级标题的序号嵌套混乱,编号也不正常,给统一排版挖下很多坑。自动列表的无损处理必须依赖office组件,性能很差,这个问题想跨平台处理,难度比较高,这个问题后面会慢慢处理。
软件顶部的五个开关,可实现单独设置某一模块,不与预处理冲突,预处理的各选项均为独立功能。
1.样式清除超级武器
是为了清除原文档中大量自定义的样式、无法格式化的顽固死框。这是排版失败的三大原因之一,另外两个原因就是前面提到的各种域和列表。这个问题用office组件比较好处理,清除样式即可,但仍然有一些标题、自定义样式无法清除,对统一排版仍然有影响,该选项解决了这些问题。如果你时对文档进行二次处理,或者你清除知道你的文档样式结构比较清晰,没有被多余的自定义样式影响时,需要对文档某些部分进行调整,不希望破坏原有整体样式,务必不要使用该选项。与最后一项反向联动。
2.转换控件、标签为纯文本
这个是为应对排版失败的第二个原因,但是5.1版本我已经解决了在保留原文中设置的交叉引用、标签、控件、参考文献引用等常规控件或域,实现对文档的正确排版,这个功能近期会继续优化,在5.1版本中暂时已经没什么实质作用了。
3.自动恢复图、表环绕设置,为嵌入型
将浮动布局的图片、表格转换为嵌入型布局,避免排版混乱。按需开启,如果你文档中自己清楚自己设置了浮动型图片活表格的时候,你就可以主动控制该选项。
4.清除多余空格
智能清理文档中的多余空格:保留英文单词间的单个空格,删除中文间的所有空格。
如果你的文档明确要求单位符号前,必须保留1个空格,不要打开该功能。后续可在工具箱内单独增加单位前增加空格的功能。
5.将↓替换为回车
从网页复制过来的内容,段落后面会有该符号,该符号在word内与下一行内容本质是一行文字,而不是真正的两行文字,与回车换行不是同一个概念。建议将该选项为常驻勾选项。
6.Tab符→的处理
在word内是个制表符,如果你自己设置的有制表符,使用制表符来控制排版,后面的选项,使用“保持原样不处理”即可
7.自动设置数学单位上标
目前支持自动设置上标的单位有: m, mm, cm, dm, km, μm, g, um, nm, kg, mg, mol, Pa, ft, in, yd等常用的,暂未扩展至TM、R标、行业专有领域的上标,大家可多多反馈;但在我工具箱有批量设置上下标的工具,仍在完善优化中,暂未发布。建议将该选项为常驻勾选项。
8.英文标点自动转换未中文标点
已排除英文段落,只转换中文段落。建议将该选项为常驻勾选项。工具箱有中文双引号的纠正工具,暂未发布。
因此本工具也支持纯英文文档排版。(英文标点符号的处理存在bug,后续或逐步解决。)
9.强制清除段落原有缩进
强制清除正文和标题的左缩进、右缩进、特殊缩进,确保后续设置正确生效。同时会禁用“自动调整右缩进”选项。建议将该选项为常驻勾选项。
10.删除所有空行
按需选择使用。
11. 取消段落“对齐到文档网格”
关于对齐文档网格的功能,很多朋友应该不太清楚是什么,他是定义一页内,最多放几行文字的意思。word的段落设置,该选项一般是默认打开的。如果设置的行数相对较小,字体又比较小,使用了对齐网格,段落间距明明是单倍行距,但是间距看起来仍然比较大,就是段落的该选择在控制,一般建议常驻勾选。
12.二次微调务必打开
与第一项反向联动,需要对已通过本程序处理过的文档进行微调时,要打开,不勾选该项时,会清除一些样式设置。
二、页面模块
当文档内有横板、竖版同时存在时,务必勾选“保持原文档页面横、竖版面”,并确保页边距符合你需要的要求。“保持原文档页面横、竖版面”后续会移至预处理内,能够不影响不同页面的页边距设置,目前打开页面设置开关,会统一将全文页边距设置为相同参数,无论横版还是竖版,word内不支持设置指定页面的各类样式,指定页面必须手动。
三、正文模块
斜体、加粗、下划线、指定其他统一颜色等一般不会全文设置,这里暂时没有增加。
四、标题模块
标题的识别无论是使用内置大纲级别还是编号类型,都需要你的文档标题层级嵌套规范,在标题大纲内使用的编号类型,如“1.”或“1”,那么在正文里的小标题序号,或者条款序号,都不能再使用“1.”或“1”,否则都会匹配为对应的标题。
1、标题设置在5.1版本做了较大幅度调整,在2.0版本时,对识别算法进行了全面升级后,该版本开始支持动态创建大纲层级,满足标书等文档的深层级设置,支持至word最多的9级大纲设置。不再是固定的4级大纲。
2、大纲级别的开关暂不取消,可以应对部分特别文档,跳过一级大纲级别设置。
3、编号类型目前支持8种,后续仍需扩展其他编号类型,如字母编号等。后缀也需增加括号种类。
4、5.1增加了保留原有大纲级别/内置标题,即直接使用原有大纲,可以减少重新设置大纲的成本,能够应对自动编号的有序列表类大纲,直接设置其样式,不需要按编号进行识别了。
5、支持编号后补空格的数量,有序列表不生效,有序列表的序号在word内部并不是显示存在的,他属于自动编码的域,不使用office组件,实现准确识别有较大的难度,主要因为有断码手动写入的可能性,需调用office组件进行转换,转换功能在工具箱内单独实现,并且需要先转换,再使用编号类型进行识别。
6、标题序号纠正替换功能在工具箱内,后续继续开发。目前工具箱有不少功能已有(全文替换批量指定关键词、标题序号更改、上下标助手、列表转换、统计学符号斜体、中文双引号成对纠正、公文条款首句处理、参考文献格式化、数据双向绑定、交叉引用、公式剧中并编号等),但未达到发布需求,需要进一步优化,增强通用性。
7、自定义标题支持,序号只需要写1或一或one,即可自动识别、自增,支持至九千九百九十九
• 第 1/一/one/ 章|节|卷|编|部|篇 • 1/一/one/ 章|节|卷|编|部|篇 • 章|节|卷|编|部|篇 1/一/one/ • Part one
五、图、表模块
1、图、表模块功能开启后,会自动剧中图、表
2、图标题注(标题)的编号支持:
必须有图开头,并带有编号,“图”与序号之间无空格 ,编号支持“数字+分隔符+数字”、和中文数字的形式,分隔符嵌套层级不限,分隔符支持点号(.)、连字符(-)、下划线(_)以及中文全角点号(.), 例如:图一、图1、图1.1.1、图1-1、图1_1_1等
3、 5.1版本增加了常用边框样式设置,三线表不用你再头秃不会设置了,但是复合表头的三线表,仍需手动设置。
六、目录、页眉页脚模块
该模块后续后拆分,并进一步细化一些功能。
“自动刷新目录域”必须依赖是office组件,未安装office,该功能不可用;主要用于少量文档处理时(暂未做上限设置,请谨慎使用,避免卡死,损坏文档),自动刷新。也有其他技术方案变通,暂不做修改。
目录级数的设置也实现了动态创建。支持修改前导符。
目录的样式设置不开启自动刷新时,不会生效,这个问题后续我会继续优化解决,因为涉及到解析库能力的限制,不太好解决。
页眉页脚暂时较为简单,后续功能模块拆分后,会进一步优化扩展功能。
七、模板
给不同类型文档配置一个参数模板,保存后,一劳永逸,公文模板、通用模板、项目模板等
发布的时,候发现一些bug,暂时给小伙伴们发个4.7的链接,修复完成后,我会第一时间放上来。下载链接:https://wwbug.lanzouu.com/i6ELM3mdmmwf
夜雨聆风