① 二值图像特征提取方法:包括分区法、变换、投影、几何矩、骨架、轮廓、结构等特征提取以及模版匹配[7]。
② 灰度特征提取方法:包括模版匹配以及几何矩、轮廓、骨架等特征提取,是很多学者认为可解决低质量图像文本识别问题的重要研究方向[7]。
3 OCR技术的研究难点
OCR技术在信息处理、资源管理、文献出版等领域应用广泛,在金融、保险、电子等行业的需求也越来越高。随着应用领域的逐渐推广,对系统的性能要求就变得越来越高,而低质量印刷体的识别往往会带来许多问题影响系统性能,其研究难点主要集中体现在以下几点:
(1)二值化会损失许多重要信息。当前的字符识别技术主要是对二值图像进行操作,但是对低质量印刷体字符的灰度图像进行二值化可能会造成信息丢失,这样达到的效果不理想,同时也不利于后面的图像处理。
(2)存在字符分割的错误。受背景、光照、字符污损、字符粘连等因素的干扰,使得字符分割的正确率受到了很大的影响,同时也影响了后面的字符识别过程。
(3)特征提取的效率低。如上文所述,低质量印刷体字符的二值化存在很多问题,不利于提高系统的性能。许多研究者希望可以直接从灰度图像提取特征,但是提取过程所用到的方法复杂繁琐,而且效率很低,没有显著的效果。
(4)字符相似导致识别率低下。各类字符之间存在许多的相似字,如“4”和“A”、“1”和“I”、“U”和“A”等,字符的误识别会影响识别的正确性。
本小节详细介绍了OCR技术的国内外研究现状,对二值化、切割和特征提取等方法进行较为详细的介绍。总而言之,至今为止低质量印刷体OCR技术主要集中在以下两个研究方向:
一方面为二值化方法的拓展、补充和改进。但是始终无法突破阈值法的局限性,虽然结合了小波分析、纹理特征等新技术,目前低质量文本图像的二值化方法仍无法取得令人满意的结果。
一方面为灰度图像特征提取方法研究,但是灰度特征中不仅包含有效信息,也包含噪声信息,最终识别性能的提高也有很大难度。
OCR技术国内外研究现状(2):http://www.youerw.com/yanjiu/lunwen_100336.html