LaTeX/PDF转Word最佳实践总结
本文总结无论如果你都应该至少执行一次使用pandoc执行从tex到word的转换,这种方式可以得到完美的公式转换如果你的内容中最多存在少量不太复杂的表格,且拥有Adobe Acrobat,应当首先选择使用Adobe Acrobat将pdf转换为word,如果对整体结果较为满意,可以基于它的结果进行微调如果通过结合以上两种方式并不能让你得到比较满意的结果,你可以尝试通过Word直接打开pdf,这种方
·
解决方案
- 公式部分建议首先尝试使用pandoc转换
.tex源文件为Word - 表格部分建议首先尝试Adobe Acrobat转换
.pdf生成文件为Word - 通常情况下可以尝试直接使用Word打开
.pdf生成文件
转换方式对比
效果对比仅针对排版布局、插图、表格、公式部分,其余未讨论部分默认在多种转换方式下无明显区别。
pandoc
- 排版布局上可能存在部分内容丢失,主要排查方向是调用第三方包和排版复杂度
- 插图可以保持,但排版丢失
- 表格混乱
- 公式几乎完美转换
总结:使用pandoc转换.tex为.docx更适用于多公式文档。
Word
- 排版布局上,字体字号等文档设置均发生变换,且行间距可能因为某些原因发生变化
- 插图有部分缺失,但排版可以保持
- 表格有一定的识别成功率,但可能解析为图片格式
- 公式识别成功率较低,但易于修正
总结:使用Word直接打开生成的.pdf文档可以得到最容易二次修改的.docx文档,因为缺失插图可以直接从源文件中重新载入,而公式部分可以借助pandoc的转换结果,排版部分工作量不大,表格部分依赖排版复杂度。
Adobe Acrobat
- 排版布局几乎可以保持
- 插图几乎可以保持
- 表格几乎可以转换
- 公式识别成功率低,可能还不如使用
Word打开的方式,甚至可能影响转换后文档布局
总结:如果文档排版简单,公式少,几乎可以实现完整转换
转换细节
公式
使用pandoc实现.tex到.docx的转换
$ pandoc paper.tex -o paper.docx
表格
- 首先尝试Adobe Acrobat
- 其次尝试使用Word直接打开
- 还不行?尝试单独对表格源码进行转换
插图
Adobe Acrobat几乎可以完美保持,如果条件允许请一定尝试。
更多推荐

所有评论(0)