求些软件或方法,提取图片或pdf中的文本
如题,先谢过 文本可以orc 我觉得cajviewer还可以啦~~反正免费的 非扫图的PDF直接用Acrobat复制就出来了或者转DOCX也行 搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢? 引用第3楼鸡蛋灌饼于2011-12-04 20:35发表的 :
非扫图的PDF直接用Acrobat复制就出来了
或者转DOCX也行 images/back.gif
那扫图的pdf呢?手头正好是这种的。如果没有直接的办法,那我只能比较傻地把每页截图再提取图片文字了
引用第4楼justevil于2011-12-04 20:56发表的:
搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢? images/back.gif
估计你得描述得再具体点才行。。。 引用第5楼dahuatttt于2011-12-04 21:18发表的:
那扫图的pdf呢?手头正好是这种的。如果没有直接的办法,那我只能比较傻地把每页截图再提取图片文字了 images/back.gif
扫图都只有OCR一途,管你什么格式
不怎么用OCR,不知道现在能不能智能的区分图文……
引用第4楼justevil于2011-12-04 20:56发表的:
搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢? images/back.gif
理论上肯定能破解
但实际你得抓得到人…… 引用第4楼justevil于2011-12-04 20:56发表的:
搭车问,有一种exe,要调用Adobe Reader,里面不让复制,也没reader那些菜单,咋把里面的文字提取出来呢? images/back.gif
如果里面的确是可选择的文字而又没加密的话,解包提源两步搞定,如果是其他情况就另说了 office 里的 onenote 就可以做到,图片塞进去,直接复制文字出来。简体和英文都可,但是不支持繁体(还是我不会设置…?)
要更专业的去下汉王OCR 看来只能OCR了。谢谢各位 anybiz pdf converter.....
页:
[1]