
引言
在开发OA(办公自动化)或各类文档管理系统时,“Word转PDF”几乎是一个无法绕开的功能需求。无论是生成合同、报告还是各类审批单据,将数据填充到Word模板并最终导出为不可篡改的PDF格式,是业务闭环的关键一环。
然而,这个看似简单的功能,在不同的系统环境(Linux/Windows)下,实现方式却千差万别,且每种方案都伴随着独特的“坑”。
作为开发了起重检测、电梯检测等多套商用系统的开发者,我将结合多年迭代经验,为你梳理出这份《PHP | Word转PDF实用方案,技术选型与填坑经验》。
在深入细节前,让我们先通过一张表直观对比主流方案的优劣:
| 需运维环境,中文字体配置繁琐 | ||||
| 无需运维,但有网络延迟和费用成本 | ||||
| 仅适合生成简单文档,复杂样式极易错乱 | ||||
| 仅限Windows,低并发场景的“神器” | ||||
| 商业收费,功能强大,转换效果最佳 |


LibreOffice的转换代码其实非常简单:
1、安装LibreOffice
sudo yum install libreoffice2、命令行核心转换命令
libreoffice --headless --convert-to pdf 输入文件路径 --outdir 输出目录路径参数解释:
--headless:无头模式,后台运行,不弹出窗口。
--convert-to pdf:指定目标格式为 PDF。
--outdir:指定转换后文件的保存目录(注意:这里填目录,不是文件名)。
实际测试示例:
假设你要将 /var/www/html/test.docx 转换为 PDF 并保存在 /var/www/html/ 目录下:
libreoffice --headless --convert-to pdf /var/www/html/test.docx --outdir /var/www/html/3、PHP封装代码
我用的是 exec() 函数 来执行上述系统命令。为了程序的健壮性,建议对文件路径和权限进行严格处理。
以下是我封装好的转换类:
<?phpclassDocxToPdfConverter{private $libreOfficePath;public function__construct($libreOfficePath = 'libreoffice'){// 如果 libreoffice 不在环境变量中,需要填写绝对路径,例如 /usr/bin/libreoffice$this->libreOfficePath = $libreOfficePath;}/*** 将 docx 转换为 pdf** @param string $inputFile 输入的 docx 文件绝对路径* @param string $outputDir 输出目录的绝对路径* @return string|false 成功返回 PDF 文件路径,失败返回 false*/public functionconvert($inputFile, $outputDir){// 1. 检查输入文件是否存在if(!file_exists($inputFile)) {echo "错误:源文件不存在。\n";return false;}// 2. 检查输出目录是否存在,不存在则尝试创建if(!is_dir($outputDir)) {if(!mkdir($outputDir, 0755, true)) {echo "错误:无法创建输出目录。\n";return false;}}// 3. 构建命令// 使用 escapeshellarg 防止路径中包含空格或特殊字符导致命令执行失败$inputFileEscaped = escapeshellarg($inputFile);$outputDirEscaped = escapeshellarg($outputDir);// 完整命令$command = "{$this->libreOfficePath} --headless --convert-to pdf {$inputFileEscaped} --outdir {$outputDirEscaped} 2>&1";// 4. 执行命令exec($command, $output, $returnVar);// 5. 处理结果if($returnVar === 0) {// 转换成功,LibreOffice 默认使用原文件名$pdfFileName = pathinfo($inputFile, PATHINFO_FILENAME) . '.pdf';$pdfFilePath = rtrim($outputDir, '/') . '/' . $pdfFileName;if(file_exists($pdfFilePath)) {return $pdfFilePath;} else {echo "错误:命令执行成功,但未找到生成的 PDF 文件。\n";return false;}} else {// 转换失败echo "错误:转换失败,返回码 {$returnVar}。\n";echo "输出信息: " . implode("\n", $output) . "\n";return false;}}}// --- 使用示例 ---$converter = new DocxToPdfConverter();$input = '/var/www/html/demo.docx'; // 你的 docx 路径$output = '/var/www/html/pdfs/'; // 你想保存的目录$result = $converter->convert($input, $output);if($result) {echo "转换成功!PDF 文件位置:" . $result;} else {echo "转换失败。";}
文件转换,运行速度很快,但是遇到之前没考虑到的问题:
①、中文乱码问题
这是因为:Linux 服务器缺少中文字体,导致转换出来的 PDF 中文变成方框或乱码。
百度查询解决方案: 将 Windows 系统下的 C:\Windows\Fonts 目录中的常用字体(如 simsun.ttc, simhei.ttf, msyh.ttf 等)上传到 Linux 服务器的字体目录(通常是 /usr/share/fonts 或 /usr/share/fonts/chinese),以及安装开源字体,并刷新字体缓存。
安装
# 安装文泉驿字体(WenQuanYi)yum install -y wqy-microhei-fonts wqy-zenhei-fonts# 安装其他开源字体yum install -y liberation-fonts dejavu-fonts
然后执行
#设置字体权限chmod 644 *.ttf *.ttc *.otf *.TTF *.TTC *.OTF# 刷新字体缓存fc-cache -fv# 查看所有已安装字体fc-list :lang=zh
实际上作用不大,能解决一部分的中文字体问题,但是如果涉及到报告内包含数学公式,这些字体远远不够,还要安装STIX、Cambria、DejaVu、Liberation等字体,或许安装了所有字体,你还会遇到文字高低不齐、文字粗细大小不一致的问题,各种奇形怪状的问题都有。
如果你能够接受Word模板发生样式改变的话,可以使用LibreOffice,这是个不错的选择,如果样式是不能发生改变的,则强烈建议你别使用。
这也是我不会去LibreOffice的主要原因之一。
②、执行权限问题
PHP 通常是以 www-data 或 nginx 用户运行的,而 LibreOffice 在转换时会生成临时文件。如果权限不足,转换会卡住或失败。
解决方案: 确保 PHP 运行用户对输入文件、输出目录以及 LibreOffice 的临时目录(通常是 /tmp)有读写权限。
③、转换后的Word宽度变小了
这通常不是因为 LibreOffice 故意缩小了内容,而是“渲染环境差异”导致的。Windows 上的 Word 和 Linux 上的 LibreOffice 对页面边距、字体宽度以及打印机驱动的理解不同,导致了缩水。
百度说解决 Linux 下 LibreOffice 排版“缩水”最彻底的方法。需要欺骗 LibreOffice,让它以为系统里有一个标准的 A4 打印机,没试过,这也是我放弃使用LibreOffice 的主要原因之一。
4、API服务
使用现成的在线转换 API,如 CloudConvert, Aspose.Words Cloud, 或 ConvertAPI。
也可以使用阿里云的Word转PDF,优点很突出:使用Office内核,高保真输出,无损转换。 完美保留原文档格式:页面、表格、字体、行距保持原始输出, 格式几乎无错乱、精准转换,效果出色。
原理:PHP 通过 cURL 将文件发送到服务商服务器,转换后下载 PDF。
优点:集成极快,无需在服务器安装任何软件,转换质量通常很高。
缺点:贵!依赖外网,文件上传下载耗时(受网络影响),客户大概率是不会接受的。
有钱的大佬可以了解一下https://market.aliyun.com/detail/cmapi00063630

5、PHPWord转换
PHPWord 是一个非常流行的纯 PHP 库,主要用于创建和读取 Word 文档。
实质上:PHPWord 本身不支持直接导出为 PDF。
变通方案:通常的做法是先用 PHPWord 生成 HTML,然后用 DomPDF、mPDF 或 TCPDF 等库将 HTML 转为 PDF。
缺点:这不是真正的“Word 转 PDF”,而是“Word 转 HTML 转 PDF”。在这个过程中,复杂的 Word 样式(如页眉页脚、复杂的表格布局)极易丢失或错乱。不推荐用于已有复杂文档的转换,仅适合生成简单的报表。
做点小功能玩玩可以的,不要把他当做你功能实现的稻草。
6、COM组件
如果你的应用不是并发性能要求的不是那么高,我强烈建议使用它。真心好用。我开发的初代检测系统一直在用,到现在快10年了,一直没出过什么太大的问题【插个可能让你匪夷所思的冷门小知识:可能有人会问,用Python的处理速度会不会更好,经过测试,比PHP慢,Windows内他也是通过调用COM组件实现的】。
他对服务器有要求,得是Windows Server ,且安装了 Microsoft Word,我常用的是MicrosoftOffice 2007,还要加装:Office2007 PDF_XPS格式插件,之后通过配置,就可以使用 COM 扩展直接调用 Word 应用程序进行转换。【WPS也行,但必须是带宏功能的版本】
原理:利用 PHP 的 COM 扩展控制 Word 进程。
优点:转换效果最完美(因为就是 Word 自己在转),兼容性最好,基本上不会有样式偏差和字体缺陷。
缺点:仅限 Windows,服务器必须安装 MS Office,并发性能差(高并发下极易造成进程堆积,甚至弹出GUI窗口导致服务器卡死)。
转换代码:
$word = new COM("Word.Application") or die ("Could not initialise Object.");// 将其设为 1 以查看 MS Word 窗口(实际打开文档)$word->Visible = 0;// 建议设置为 0,禁用诸如“您希望 Microsoft Word 成为默认的……”之类的提示。$word->DisplayAlerts = 0;// 打开 Word 2007 - 2013 文档$word->Documents->Open('yourdocument.docx');//这个是绝对文件地址,如c:\www\1.txt这样的地址才通过// 将其保存为“Word 2003”格式$word->ActiveDocument->SaveAs('newdocument.doc');//转换成doc格式// 将 2007 版至 2013 版的 word 文档转换为 PDF 格式$word->ActiveDocument->ExportAsFixedFormat('yourdocument.pdf', 17, false, 0, 0, 0, 0, 7, true, true, 2, true, true, false);//转换为pdf模式// 退出 Word 程序$word->Quit(false);// 清理unset($word);
既然好用,那缺点也是可以克服的,例如:转换完成后,及时清理进程残留,转换任务作成异步的消息队列等等。
清理进程的办法,可以浏览我的CSDN文章:
https://blog.csdn.net/xzszxiong/article/details/132910338?spm=1011.2415.3001.5331设置文档和相关软件,请关注后,回复:W2P
7、AsposeWord
这个比较复杂,我们下次单独分一章节来讲。
8、选型建议
回顾这十几年的OA开发历程,从最初的金格Office插件,到LibreOffice的折腾,再到如今的Aspose.Words,技术选型的本质是在成本、效果和运维复杂度之间寻找平衡。
如果你是个人开发者或做简单Demo: 用PHPWord凑合,或者直接上在线API。
如果你是内网Windows环境,且并发低: 坚定地使用COM组件,它最稳定,样式有保证。
如果你是高并发Linux环境,且样式必须有保证,直接Aspose.Words,虽然他会你掉很多头发。
如果觉得这篇文章对你有用,欢迎点赞、在看、转发三连支持!
关注我们,获取更多 PHP 实战教程与技术干货!

愿每一个做技术、做服务的人,都能被温柔以待,不负努力,不负自己,越来越好。
夜雨聆风