dahuatttt 发表于 2011-12-4 17:52

求些软件或方法,提取图片或pdf中的文本

如题,先谢过

Punisher 发表于 2011-12-4 19:04

文本可以orc

宅迷心窍 发表于 2011-12-4 20:14

我觉得cajviewer还可以啦~~反正免费的

鸡蛋灌饼 发表于 2011-12-4 20:35

非扫图的PDF直接用Acrobat复制就出来了
或者转DOCX也行

justevil 发表于 2011-12-4 20:56

搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢?

dahuatttt 发表于 2011-12-4 21:18

引用第3楼鸡蛋灌饼于2011-12-04 20:35发表的  :
非扫图的PDF直接用Acrobat复制就出来了
或者转DOCX也行 images/back.gif

那扫图的pdf呢?手头正好是这种的。如果没有直接的办法,那我只能比较傻地把每页截图再提取图片文字了

引用第4楼justevil于2011-12-04 20:56发表的:
搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢? images/back.gif

估计你得描述得再具体点才行。。。

鸡蛋灌饼 发表于 2011-12-4 23:30

引用第5楼dahuatttt于2011-12-04 21:18发表的:

那扫图的pdf呢?手头正好是这种的。如果没有直接的办法,那我只能比较傻地把每页截图再提取图片文字了 images/back.gif

扫图都只有OCR一途,管你什么格式
不怎么用OCR,不知道现在能不能智能的区分图文……
引用第4楼justevil于2011-12-04 20:56发表的:
搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢? images/back.gif

理论上肯定能破解
但实际你得抓得到人……

Breeze 发表于 2011-12-4 23:38

引用第4楼justevil于2011-12-04 20:56发表的:
搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢? images/back.gif

如果里面的确是可选择的文字而又没加密的话,解包提源两步搞定,如果是其他情况就另说了

caibing 发表于 2011-12-4 23:40

office 里的 onenote 就可以做到,图片塞进去,直接复制文字出来。简体和英文都可,但是不支持繁体(还是我不会设置…?)
要更专业的去下汉王OCR

dahuatttt 发表于 2011-12-6 21:04

看来只能OCR了。谢谢各位

vaonon 发表于 2011-12-6 21:11

anybiz pdf converter.....
页: [1]
查看完整版本: 求些软件或方法,提取图片或pdf中的文本