admin管理员组文章数量:1637943
2024年7月24日发(作者:)
巧用OCR,为你编辑文档省钱又省力
相信从事文字工作的同事都遇到或可能遇到这样的问题:有
时想将报刊、纸质文件这些文本资料上的文字变成自己的“东西”,
但苦于文字资料太长,工作时间又紧,加上自己的打字速度太慢
而不又想花钱找专业打字员,有没有更好的办法来解决?有!那就
是用好你办公桌上的扫描仪,下载一个OCR字符识别软件,几分
钟就能搞定,为你编辑文档省钱又省力。
“OCR”是英文“Optical Character Recognition”(光学字
符识别)的缩写。该技术是指用电子设备(例如扫描仪或数码相
机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,
然后用字符识别方法将形状翻译成计算机文字的过程;即,对文
本资料进行扫描,然后对图像文件进行分析处理,获取文字及版
面信息的过程。这也就是笔者运用扫描仪与OCR技术的结合,实
现编辑文档的理论依据。
这里暂以“汉王OCR6.0”版本(当前最新版为汉王 PDF OCR
8.1 简体中文版,免费)为例,利用主管单位配发、各辖属机构
普遍使用的柯达(Kodak i1200)扫描仪予以示范,希望对感兴趣
的朋友有所帮助。
第一步:打开“汉王OCR6.0”应用程序,单击“文件”,“选
择扫描仪”,在“选择来源”对话框选择“WIA-KODAK i1200 Scanner
- 1 -
1.0”扫描仪;
第二步:单击“文件”,选择“扫描”,在“用KODAK i1200
Scanner扫描”对话框,选择“黑白照片或文本”选项,根据需
要设置“纸张大小”,而后点击“扫描”,完成资料的扫描。
扫描后的文件为图片格式,文件名为*.tif,默认保存路径为
c:hwocr60image,你也可先创建文件夹,按“扫描到”按钮,
更改保存路径,将自己命名的扫描件保存到这个文件夹,需要转
发或使用时直接调用。
第三步:单击“识别”,选择“开始识别”,在编辑框内编辑
因识别错误或需要更改的文字,然后点击“输出”、“到指定文件
格式”,在“保存识别文件”对话框选择保存路径和保存类型。
编辑过的识别件为记事本文件格式,文件名为*.txt,默认保
存路径也为c:hwocr60image,你同样可以创建属于自己的文件
夹。识别后的文件保存后,打开这个记事本文件,复制并粘贴到
自己需要编辑的文档就可以了。
对于曾经扫描并保存过的文件,也可以进行识别。具体方法
请参照第二个步骤,单击“文件”后,选择的不是“扫描”而是
“打开图像”,其余步骤完全一样。(abchinaqx)
- 2 -
版权声明:本文标题:巧用汉王OCR,为你编辑文档省钱又省力 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dongtai/1721810305a898593.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论