找回密码
 立即注册
搜索
查看: 1874|回复: 18

[求助] 翻译图片PDF(扫描版)有好用的工具吗?

[复制链接]
     
发表于 2026-6-9 23:47 来自手机 | 显示全部楼层 |阅读模式
本帖最后由 Kazuhira 于 2026-6-12 13:26 编辑

更新:折腾一圈感觉不太适合多图排版的电子书,打算试试漫画翻译那种不改排版的软件,还有OCR截图翻译划词翻译软件了

如题,楼主搜索到有个沉浸式翻译的babel-doc,但是不支持扫描版,以前是用LunaTranslator(Galgame翻译器)的OCR翻译配合电脑上跑的sakuraLLM来一段一段画框翻译的
回复

使用道具 举报

     
发表于 2026-6-9 23:50 来自手机 | 显示全部楼层
通用的方案是讲扫描版 pdf 用 OCR 和 llm 转化成 markdown 格式的,再整体翻译,网上有不少这种工具,就是要费点前,得调用 deepseek ocr
回复

使用道具 举报

发表于 2026-6-9 23:52 来自手机 | 显示全部楼层
你要是有python环境可以试试marker
回复

使用道具 举报

     
发表于 2026-6-10 06:04 来自手机 | 显示全部楼层
如果是图文并茂的那种图片页面,用gpt-image-2的api接口 用图片编辑模式直接生成翻译目标语言的图片 不但能翻译文字 还能把图表中的文字也一并翻译 还不影响排版
回复

使用道具 举报

     
 楼主| 发表于 2026-6-10 07:33 来自手机 | 显示全部楼层
本帖最后由 Kazuhira 于 2026-6-10 07:48 编辑
dinghanzi 发表于 2026-6-10 06:04
如果是图文并茂的那种图片页面,用gpt-image-2的api接口 用图片编辑模式直接生成翻译目标语言的图片 不但能 ...

有道理,还能这么玩

稍微试了一下,翻译出来的文字内容有点说胡话
回复

使用道具 举报

发表于 2026-6-10 07:44 来自手机 | 显示全部楼层
正好这几天翻译了一批 PDF ppt都有
方法很偷懒 丢到codex里 告诉chatgpt能用Python让它自己跑就行
翻译完一个后固化下skill 后面就快了

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-10 07:55 来自手机 | 显示全部楼层
分成两个任务呗,先用umiocr转成双层pdf再翻译。

或者,如果电脑够好的话,可以试试pdfmathtranslate

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

发表于 2026-6-10 08:20 | 显示全部楼层
我用paddleocr做过一个批量的pdf转md的脚本,主要用来转国标还不错。支持表格。    Re:Source
回复

使用道具 举报

     
发表于 2026-6-10 08:35 | 显示全部楼层
https://www.bilibili.com/video/BV1RkyBBVE3f/
可以试试,用过还可以。
回复

使用道具 举报

     
发表于 2026-6-10 08:40 来自手机 | 显示全部楼层
abbyfine reader+llm校对?
回复

使用道具 举报

     
发表于 2026-6-10 09:00 来自手机 | 显示全部楼层
有道翻译,可以处理扫描版pdf
回复

使用道具 举报

     
发表于 2026-6-10 09:01 来自手机 | 显示全部楼层
单位有会员,所以一直用wps

—— 来自 Xiaomi 22081212C, Android 15, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-10 09:04 | 显示全部楼层
本帖最后由 当光停止 于 2026-6-10 09:05 编辑

mineru paddleocr啥的转markdown再翻译就行。
mineru官网有每日免费额度(单文件限制200页)。
回复

使用道具 举报

     
发表于 2026-6-10 09:07 | 显示全部楼层
如果是量大但是时间不着急的话,我一般都是直接ocr.space就上去了,还支持多语种,对小语种人士十分友好,有时候不想吭哧吭哧自己打字就用这个
回复

使用道具 举报

     
发表于 2026-6-10 09:24 来自手机 | 显示全部楼层
本帖最后由 Freewolf 于 2026-6-10 09:26 编辑

paddleocr有网页版和api,给的免费额度还挺多的,转成markdown再用ainiee之类的工具翻译
回复

使用道具 举报

     
发表于 2026-6-10 09:44 来自手机 | 显示全部楼层
既然llm都用本地的了,资源够的话mineru也可以本地部署的,实际效果还可以。
回复

使用道具 举报

发表于 2026-6-10 13:10 | 显示全部楼层
以前用过doc2x,转换量不大的话免费额度完全够用的

论坛助手,iPhone
回复

使用道具 举报

     
 楼主| 发表于 2026-6-12 13:27 来自手机 | 显示全部楼层
感觉各种转markdown以后翻译的流程有点不符合预期,因为markdown转换下来以后也会丢失排版和可读性可能适合一些不复杂的文件
回复

使用道具 举报

     
发表于 2026-6-12 13:45 | 显示全部楼层
最近再摸索agent配置Python,其中有个markitdown可以提取PDF,另外设置好Markdown模板,准备喂文档进去就自动提取内容
具体的skill让ai自己编……根据需求再调整


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-24 11:03 , Processed in 0.112466 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表