翻译图片PDF(扫描版)有好用的工具吗?
本帖最后由 Kazuhira 于 2026-6-12 13:26 编辑更新:折腾一圈感觉不太适合多图排版的电子书,打算试试漫画翻译那种不改排版的软件,还有OCR截图翻译划词翻译软件了
如题,楼主搜索到有个沉浸式翻译的babel-doc,但是不支持扫描版,以前是用LunaTranslator(Galgame翻译器)的OCR翻译配合电脑上跑的sakuraLLM来一段一段画框翻译的 通用的方案是讲扫描版 pdf 用 OCR 和 llm 转化成 markdown 格式的,再整体翻译,网上有不少这种工具,就是要费点前,得调用 deepseek ocr 你要是有python环境可以试试marker 如果是图文并茂的那种图片页面,用gpt-image-2的api接口 用图片编辑模式直接生成翻译目标语言的图片 不但能翻译文字 还能把图表中的文字也一并翻译 还不影响排版 本帖最后由 Kazuhira 于 2026-6-10 07:48 编辑
dinghanzi 发表于 2026-6-10 06:04
如果是图文并茂的那种图片页面,用gpt-image-2的api接口 用图片编辑模式直接生成翻译目标语言的图片 不但能 ...
有道理,还能这么玩
稍微试了一下,翻译出来的文字内容有点说胡话 正好这几天翻译了一批 PDF ppt都有
方法很偷懒 丢到codex里 告诉chatgpt能用Python让它自己跑就行
翻译完一个后固化下skill 后面就快了
—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99 分成两个任务呗,先用umiocr转成双层pdf再翻译。
或者,如果电脑够好的话,可以试试pdfmathtranslate
—— 来自 鹅球 v3.3.96 我用paddleocr做过一个批量的pdf转md的脚本,主要用来转国标还不错。支持表格。 Re:Source https://www.bilibili.com/video/BV1RkyBBVE3f/
可以试试,用过还可以。 abbyfine reader+llm校对? 有道翻译,可以处理扫描版pdf 单位有会员,所以一直用wps
—— 来自 Xiaomi 22081212C, Android 15, 鹅球 v3.5.99 本帖最后由 当光停止 于 2026-6-10 09:05 编辑
mineru paddleocr啥的转markdown再翻译就行。
mineru官网有每日免费额度(单文件限制200页)。
如果是量大但是时间不着急的话,我一般都是直接ocr.space就上去了,还支持多语种,对小语种人士十分友好,有时候不想吭哧吭哧自己打字就用这个 本帖最后由 Freewolf 于 2026-6-10 09:26 编辑
paddleocr有网页版和api,给的免费额度还挺多的,转成markdown再用ainiee之类的工具翻译 既然llm都用本地的了,资源够的话mineru也可以本地部署的,实际效果还可以。 以前用过doc2x,转换量不大的话免费额度完全够用的
论坛助手,iPhone 感觉各种转markdown以后翻译的流程有点不符合预期,因为markdown转换下来以后也会丢失排版和可读性可能适合一些不复杂的文件 最近再摸索agent配置Python,其中有个markitdown可以提取PDF,另外设置好Markdown模板,准备喂文档进去就自动提取内容
具体的skill让ai自己编……根据需求再调整
页:
[1]