admin管理员组

文章数量:1650876

本人文字狗,经常会碰到从pdf中提取文字的问题,给人pdf就是为了防止别人提取内容,但是还是有解决方案的:

1.可以尝试直接用word(最好是高版本)直接打开pdf,这还是别人给我说的,我自己一开始都不知道,那些直接用word另存为的pdf不仅可以打开,甚至可以还原目录结构

2.Adobe acrobat 打开PDF文件并另存为word。    成功率较高,但是格式不一定能还原,一般存在的问题是每2行之间会自动添加空格,复制后使用word的替换功能将空格直接替换掉即可。比较好用,而且acrobat比较容易获取

3.使用ABBYY,该软件收费

4.使用各种第三方小工具,尝试过许多,个人感觉效果一般

总结:建议首先尝试方法1,不行再试方法2

本文标签: 几个方案PDFword