乐于分享
好东西不私藏

【办公自动化—Word篇33】word文档批量查重3.0升级版

【办公自动化—Word篇33】word文档批量查重3.0升级版

在日常写作、教学管理或资料审核中,你是否经常遇到这些问题:

学生提交的作业、教案内容高度相似,人工逐句对比太耗时间

公司多个版本方案、汇报稿反复修改,却不知道哪些内容被重复使用

查重结果看到了,但在原文中翻来翻去,始终找不到具体位置

现在,这套 Word 文档查重工具 3.0 升级版,在原有查重能力基础上,进一步解决了“定位难、判断难”的问题。


2.0 版本新增升级点

1.查重结果可定位到页数和行数

每一条被判定为重复的句子,都会在结果中标注:

所在页数
所在行号

无需再手动全文搜索,直接回到原文对应位置即可查看、修改。


2. 新增文档整体重复率统计

在输出结果中,会自动显示:

查重结果:重复率 xx%

该重复率表示:
文档中 所有高于阈值的重复句子,占全文的比例,可用于快速评估整体重复情况,而不仅仅是零散句子。


3. 新增忽略规则选项

查重时可根据需要选择:

是否忽略数字
是否忽略符号和标点

例如编号、日期、条款序号等,不再干扰查重判断,让结果更贴近真实内容重复情况。

3.0 版本新增升级点

1.增加弹窗excel文件用于进度条显示,大文件随时可知道运行进度

新增了进度显示,分别显示总对比文档数,当前对比文档数,当前对比句子数目,已经当前的百分比进度


2. 解决了大文件会运行出现未响应的问题


功能说明

自定义查重源文件

可选择任意一个 Word 文档作为“对比原文”,其内容作为查重基准。

支持单个或批量比对

可选择:

  • 对比单个 Word 文件

  • 或对比一个文件夹内的所有 Word 文档

逐个与源文件进行句级比对。

智能重复判断

  • 逐句计算相似度

  • 输入重复率阈值(如 60%)

  • 超过阈值的句子即判定为重复

支持更精细的重复识别,而不仅是完全相同。

自动输出结构化结果

所有查重结果都会输出到指定的 Word 文档中,包含:

重复率统计
重复句子内容
所在页数与行数
来源文件信息

结果清晰,便于后续检查、修改和存档。



使用流程(仅需四步)

1️⃣ 查看下图流程,如需视频讲解可查看各大平台账号:技已成舟

2️⃣ 打开 Word,按下 Alt + F11 打开 VBA 编辑器

3️⃣ 粘贴代码

4️⃣ 按 F5 运行宏,选择对比文件、设置阈值、选择是否忽略数字和符号,指定输出文档,即可完成查重

具体代码公众号回复:文档查重3.0  获取

具体代码公众号回复:文档查重3.0  获取