DocuTranslate:打工人狂喜!这款开源神器一键翻译PDF/Word/Excel,格式不乱还免费
摘要:DocuTranslate是一款基于大模型的开源翻译工具,突破传统翻译格式错乱的局限,支持PDF、Word、Excel等10+文件格式,完美保留原文表格、公式和代码结构。工具具有术语表自动生成、OCR扫描识别、局域网共享等特色功能,支持本地离线部署和API调用。提供40M轻量安装包,3步即可完成配置,适用于科研文献、商务合同、视频字幕等多种场景,实测翻译效率提升300%。项目持续更新,已在G
我们也许经常会遇到对着满屏英文的文献无从下手,复制到翻译里出现格式错乱,翻译不准的问题,当好不容易将文档的翻译搞定,但是表格或公式格式已经面目全非。
最近开源的一个DocuTranslate工具能解决当前痛点,其底层基于大模型的强大能力,轻松搞定PDF、Word、Excel、Markdown等多种格式,甚至把文献中的公式和代码都能精准的翻译。
项目地址:https://github.com/xunbu/docutranslate/tree/main
欢迎大家关注我的公众号:大模型论文研习社
往期回顾:大模型也会 “脑补” 了!Mirage 框架解锁多模态推理新范式,无需生成像素图性能还暴涨
欢迎大家体验我的小程序:王哥儿LLM刷题宝典,里面有大模型相关面经,正在持续更新中
究竟有多能打?这些功能太顶了
我们都知道,常规的翻译通常最多解决文本的翻译,而格式这些会被完全破坏,但该工具在翻译后不仅能实现语义的准确识别,甚至将原始格式完全保留。此外,其针对PDF的学术论文,能精准的识别到公式和表格,然后进行翻译。该工具还存在如下核心亮点:
✅ 支持多种格式:能翻译 pdf、docx、xlsx、md、txt、json、epub、srt 、ass等多种文件。
✅ 自动生成术语表:支持自动生成术语表实现术语的对齐。
✅ PDF表格、公式、代码识别:凭借docling、minerupdf解析引擎实现对学术论文中经常出现的表格、公式、代码的识别与翻译
✅ json翻译:支持通过json路径(jsonpath-ng语法规范)指定json中需要被翻译的值。
✅ Word/Excel保持格式翻译:支持docx、xlsx文件(暂不支持doc、xls文件)保持原格式进行翻译。
✅ 多ai平台支持:支持绝大部分的ai平台,可以实现自定义提示词的并发高性能ai翻译。
✅ 异步支持:专为高性能场景设计,提供完整的异步支持,实现了可以多任务并行的服务接口。
✅ 局域网、多人使用支持:支持在局域网中多人同时使用。
✅ 交互式Web界面:提供开箱即用的 Web UI 和 RESTful API,方便集成与使用。
✅ 小体积、多平台懒人包支持:不到40M的windows、mac懒人包(不使用docling本地解析pdf的版本)。
3步上手,小白也能轻松玩转
对于希望快速上手的用户,开发这在 GitHub Releases上提供整合包。您只需下载、解压,并填入您的 AI 平台 API-Key 即可开始使用。
DocuTranslate: 标准版,使用在线的 minerU 引擎解析PDF文档,如果不需要本地解析pdf选这个版本(推荐)。
DocuTranslate_full: 完整版,内置 docling 本地PDF解析引擎,需要本地解析pdf选这个版本。
如果习惯用命令行,通过Python安装也很简单:
# 基础安装
pip install docutranslate
# 如需解析复杂PDF,加装docling引擎
pip install docutranslate[docling]
启动服务后访问localhost:8010,就能看到简洁直观的操作界面。上传文件、选择目标语言、点击翻译,一杯咖啡的时间就能拿到结果。
对于开发者来说,还能通过代码调用实现批量处理。以翻译docx为例:
import asyncio
from docutranslate.workflow.docx_workflow import DocxWorkflow
async def main():
workflow = DocxWorkflow(api_key="你的密钥", model_id="gpt-4o")
workflow.read_path("需要翻译的文档.docx")
await workflow.translate_async()
workflow.save_as_docx("翻译结果.docx")
asyncio.run(main())

这些场景,用它效率直接翻倍
不同职业的用户都能在这里找到专属福利:
科研党再也不用对着英文文献头疼。用mineru引擎开启OCR模式,哪怕是扫描版PDF也能精准识别翻译,表格和公式的呈现效果堪比人工排版。
跨境打工人的合同翻译效率提升300%。docx翻译保留原格式,不用在译文里重新调整排版,连页眉的公司Logo都不会错位。
自媒体创作者处理字幕更轻松。导入srt文件自动翻译,时间轴分毫不差,导出后直接能用在视频剪辑软件里。
更贴心的是,它支持局域网多人共享使用。团队里只需一人部署,其他人通过IP地址访问,再也不用每个人都配置一遍API密钥。
离线也能用?这些细节太良心
考虑到部分用户的网络环境,开发团队做了周全的离线支持方案:
- 用Ollama部署本地大模型,无需联网就能翻译
- 提前下载docling模型包,PDF解析完全本地化
- 内置katex字体,公式渲染不依赖外部资源
对于有特殊需求的用户,软件还提供丰富的自定义选项:通过环境变量修改默认端口,设置代理解决网络问题,甚至能调整分块大小和并发数来优化翻译速度。
目前这个项目还在快速迭代,最近的更新里已经支持了ass字幕翻译、术语表自定义等实用功能。开发者在GitHub上保持着活跃更新,用户反馈的问题往往几天内就能得到修复。
说在最后
在这个信息高速流动的时代,语言壁垒不该成为获取知识的阻碍。DocuTranslate用技术打破了这种隔阂——它不仅是一个翻译工具,更像是一座连接不同语言世界的桥梁。
最后想问问大家:你在工作中遇到过哪些翻译难题?如果有机会给这个工具提建议,你最希望增加什么功能?欢迎在留言区分享你的想法~
更多推荐



所有评论(0)