您当前的位置: 主页 > 使用教程 > 常见问题 >

如何提高ocr的文字识别率

  随着捷速ocr文字识别软件用户的增加,用户也给我们反馈了很多宝贵的意见和建议。如何提高ocr的文字识别率?就是一个高频率提及的问题。
 
  文件扫描后图像质量的好坏是重点之一,如:出现黑边框、混杂有图形表格、文字歪斜等都会影响OCR识别率,甚至无法进行。一般OCR要求识别的文稿以黑白模式(Line/art)、300dpi或更高的分辨率扫描。如果扫描时使用的分辨率太低,也会造成文字识别率下降。
 
  要提高OCR的文字识别率可通过以下方法改善:
 
  1、我们首先要适当调整原稿。对于报纸一类的低质量稿件,可以考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报纸,OCR的识别率有明显的提高,完全可以和打印稿相比。
 
  2、扫描过程中原稿一定要放置正确,不能倾斜,否则扫描出来的字体也是倾斜的,OCR软件将无法正确识别。如果实在无法将原稿摆正,那就需要使用“自动倾斜校正”或者“手动纠斜”功能纠正字体的倾斜。当然选择适当的扫描参数也非常重要,一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对文字的正确识别非常关键,所以我们要调节到适当值。
 
  3、而对于分辨率,用户选择的原则应为不求最“高”,只求最“佳”。如果分辨率太高,扫描的时间将会大大增加,图形所需的空间也会成倍地增长,无实际意义;如果分辨率太低,给OCR软件的信息量不足,识别率就不会很高。
 
  4、扫描后,我们还要观察图像是否有污点现象,如有则应使用图像处理软件将这些污点擦去。同时如果有图像存在,也会影响OCR的文字切分,可使用“图像的块擦拭”工具将文档中的图像去除。此外,还应采用适当的辨识方式,注意稿件是横排还是竖排,可选择合适的编排格式按钮,以保持对应。最后,我们还可再次适当地调节对比度和亮度,因为这样可以增加文字和背景的对比度,从而最终均可达到95%以的OCR识别正确率,再略加校对一遍就万事OK了。
 
  “如果您仍然有疑问,可以联系我们的客服人员QQ:4006685572 电话:4006685572 邮箱support@jsocr.com”。

相关关键词:
 
分享到:

分类索引

软件下载 软件购买

统一服务热线
400-668-5572

最新教程

热门点击

相关文章

在线客服

客服热线(7*24服务热线)

400-668-5572

181-2107-4602

点击企业QQ在线咨询
QQ: 4006685572

QQ交谈

技术支持:
support@huduntech.com

商务合作:
bd@huduntech.com