Kazuhira 发表于 2026-6-9 23:47

翻译图片PDF(扫描版)有好用的工具吗?

本帖最后由 Kazuhira 于 2026-6-12 13:26 编辑

更新:折腾一圈感觉不太适合多图排版的电子书,打算试试漫画翻译那种不改排版的软件,还有OCR截图翻译划词翻译软件了

如题,楼主搜索到有个沉浸式翻译的babel-doc,但是不支持扫描版,以前是用LunaTranslator(Galgame翻译器)的OCR翻译配合电脑上跑的sakuraLLM来一段一段画框翻译的

松下仓鼠 发表于 2026-6-9 23:50

通用的方案是讲扫描版 pdf 用 OCR 和 llm 转化成 markdown 格式的,再整体翻译,网上有不少这种工具,就是要费点前,得调用 deepseek ocr

萨格诺伊 发表于 2026-6-9 23:52

你要是有python环境可以试试marker

dinghanzi 发表于 2026-6-10 06:04

如果是图文并茂的那种图片页面,用gpt-image-2的api接口 用图片编辑模式直接生成翻译目标语言的图片 不但能翻译文字 还能把图表中的文字也一并翻译 还不影响排版

Kazuhira 发表于 2026-6-10 07:33

本帖最后由 Kazuhira 于 2026-6-10 07:48 编辑

dinghanzi 发表于 2026-6-10 06:04
如果是图文并茂的那种图片页面,用gpt-image-2的api接口 用图片编辑模式直接生成翻译目标语言的图片 不但能 ...

有道理,还能这么玩

稍微试了一下,翻译出来的文字内容有点说胡话

qwjhb 发表于 2026-6-10 07:44

正好这几天翻译了一批 PDF ppt都有
方法很偷懒 丢到codex里 告诉chatgpt能用Python让它自己跑就行
翻译完一个后固化下skill 后面就快了

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99

heyeshuang 发表于 2026-6-10 07:55

分成两个任务呗,先用umiocr转成双层pdf再翻译。

或者,如果电脑够好的话,可以试试pdfmathtranslate

—— 来自 鹅球 v3.3.96

fat 发表于 2026-6-10 08:20

我用paddleocr做过一个批量的pdf转md的脚本,主要用来转国标还不错。支持表格。    Re:Source

jbtc2224052 发表于 2026-6-10 08:35

https://www.bilibili.com/video/BV1RkyBBVE3f/
可以试试,用过还可以。

勿徊哉 发表于 2026-6-10 08:40

abbyfine reader+llm校对?

lawsherman 发表于 2026-6-10 09:00

有道翻译,可以处理扫描版pdf

xdonic 发表于 2026-6-10 09:01

单位有会员,所以一直用wps

—— 来自 Xiaomi 22081212C, Android 15, 鹅球 v3.5.99

当光停止 发表于 2026-6-10 09:04

本帖最后由 当光停止 于 2026-6-10 09:05 编辑

mineru paddleocr啥的转markdown再翻译就行。
mineru官网有每日免费额度(单文件限制200页)。

4396777 发表于 2026-6-10 09:07

如果是量大但是时间不着急的话,我一般都是直接ocr.space就上去了,还支持多语种,对小语种人士十分友好,有时候不想吭哧吭哧自己打字就用这个

Freewolf 发表于 2026-6-10 09:24

本帖最后由 Freewolf 于 2026-6-10 09:26 编辑

paddleocr有网页版和api,给的免费额度还挺多的,转成markdown再用ainiee之类的工具翻译

tylunas 发表于 2026-6-10 09:44

既然llm都用本地的了,资源够的话mineru也可以本地部署的,实际效果还可以。

泥头车 发表于 2026-6-10 13:10

以前用过doc2x,转换量不大的话免费额度完全够用的

论坛助手,iPhone

Kazuhira 发表于 2026-6-12 13:27

感觉各种转markdown以后翻译的流程有点不符合预期,因为markdown转换下来以后也会丢失排版和可读性可能适合一些不复杂的文件

アコ 发表于 2026-6-12 13:45

最近再摸索agent配置Python,其中有个markitdown可以提取PDF,另外设置好Markdown模板,准备喂文档进去就自动提取内容
具体的skill让ai自己编……根据需求再调整


页: [1]
查看完整版本: 翻译图片PDF(扫描版)有好用的工具吗?