工作中我们有时会遇到需要将word转换为 pdf的场景或者想要知道 .doc老版 word文档的页数。由于老版doc格式实现时内部没有记录页数,需要借住转换为 pdf的方式获取其页数
工作当中我使用了LibreOffice的方式实现了word到 pdf的转换。
一、LibreOffice 是什么
LibreOffice是免费开源的跨平台办公套件,由文档基金会开发,源自OpenOffice.org分支,包含Writer(文字处理)、Calc(电子表格)等6大核心组件,支持Windows、macOS、Linux,原生格式为ODF,兼容微软Office等多种格式,可免费商用。
二、为什么能实现Word转PDF
1. 完整解析引擎:内置成熟文档解析与排版引擎,可精准读取.doc/.docx等Word格式,处理复杂排版、字体、图片、页眉页脚等元素。
2. 原生PDF导出能力:无需中间格式(如HTML),直接将解析后的文档内容通过内部PDF生成器转换为PDF,保留原格式与样式,转换效率高。
3. 命令行/API调用:支持--headless无界面模式,可通过命令行或JODConverter等工具调用,适合批量/自动化转换场景,Mac上也能稳定运行。
三、快速上手(Mac命令行示例)
使用前需要先下载LibreOffice,并打开它
/Applications/LibreOffice.app/Contents/MacOS/soffice --headless --convert-to pdf 输入文档.docx --outdir 输出目录