扫描文件进行ocr识别的技巧
扫描文件ocr识别的识别率问题,用户们见仁见智,意见不一。大家用的都是捷速
ocr文字识别软件,但是对识别率的观点却不一样,为此
捷速ocr文字识别软件的开发人员进行了深入的研究,在确定不是软件问题后有对外围因素做了分析,最后找到了症结所在。这个问题出现在扫描阶段,扫描出的文件质量决定了识别率的高低。所以,下面给大家介绍扫描时的技巧,帮助大家提高文字识别率。
扫描技巧:
识别率的高与低,很大程度取决于扫描阶段,其中原稿的质量起着决定性的作用。对于报纸等非常低劣的原稿,我们可通过扫描界面减小或增大亮度参数的方法提高识别率,如果还未达到要求,还可增大扫描时的分辩率。分辩率的提高会增大图像的大小,所以就会延长扫描时的时间。不过,对于太小的字体,或不太清楚的文字,适当增大分辩率,可提高识别率。对于杂志、书本等字迹清晰,对比强烈,质量比较好的原稿,可以把亮度设为0,分辩率设为300,在此基础上,根据预扫得到的图像,本着字体笔划即不能互相粘连漆黑一片,又不能断笔画少点的原则进行调整。
温馨提示:识别后得到的文本,它是根据扫描后的图像排版的,特别是像报纸,杂志等多栏式的原稿,它不合乎我们对日常文稿的排版要求,所以我们对识别后的文稿,一般这要进行一次排版操作。这种排版操作,OCR系统的后处理程序一般都不能完成,我们要借助Word、WPS等排版软件进行操作。“如果您仍然有疑问,可以联系我们的客服人员QQ:4006685572 电话:4006685572 邮箱support@jsocr.com”。