1.4 手写字符识别的方法
手写字符的识别方法不尽相同,但是一般都会涉及到以图1.1所示流程图中所展现出的几个流程:
图1.1 常用字符识别流程图
该流程中各处理阶段的具体工作内容如下:
1.4.1 图像获取
图像获取就是借摄像头、扫描仪等输入设备将存在于纸张或是其他媒介上的手写字符图像像素信息保存下来的过程,是图像识别的重要部分。图像获取系统的性能将直接影响字符的识别结果,因此,应尽量保证所获得的图像具有较高的分辨率和较低的噪声干扰。光学传感器等传感器技术在自动视觉检测中的图像获取环节得到了广泛的应用[5]。电耦合原件(CCD)和金属氧化物半导体原件(CMOS)作为光学传感器的两大重要分类,在日常生活中占有较为重要的使用地位。两类光学传感器各有其独特之处,较之CMOS,CCD的体积更为小巧、分辨率也较高,在自动视觉检测系统中应用广泛。通过图像获取得到的数字图像包含了图像处理所需要的重要信息,因此,图像本身的质量是好是坏变得非常关键。好的光源和照明能直接影响图像的质量,因此,在使用摄像头获取图像时,应尽量使图像的有用信息突出,增加有用信息与无用部分的对比度,保证图像质量。
1.4.2 图像预处理
图像样本在生成过程中,不可避免地会产生一些噪声干扰,降低图像质量,如果不予以消除,将直接影响识别结果。为了得到高质量的图像,使得图像中的重要信息能很容易地被检测到,以提高特征提取、匹配以及识别过程的可靠性,就需要对图像进行预处理,消除或是削弱图像中无用信息的干扰。文献中常用的预处理方法包括二值化、图像增强、形态滤波等。
1.4.2 特征提取
建立字符标准库的前提是要进行特征提取,特征提取作为一个极为重要的部分对后续的手写字符识别有积极意义。进行特征提取要遵守特征易于提取的原则,尽量避免选择较难提取或是匹配的特征,尽可能地降低特征文数和减少特征向量,以提高识别系统的分辨能力。特征提取的成功与否会在一定程度上影响系统的识别精度和可靠性,因此选择不变性高、突出性好、易于识别的特征很有必要。常用的特征提取方法有基于结构特征的提取方法和基于统计特征的提取方法[6]。
1.4.3 字符识别
随着字符识别相关理论的发展,字符识别的方法越来越多,每种识别方法都有其各自的优点,但也有其不足之处。以下所展示的几种字符识别方法是当前较为常见的识别方法:
(1)基于模板匹配的识别方法
模板匹配法进行识别的本质就是取待识别字符与模板字符相比较,计算两者之间的相似性,并找出相似性最大者作为待识别样本的识别结果。模板匹配法一般有两种:一种是先提取字符特征,再与模板进行匹配;另一种则没有特征提取这一过程,直接取待识别样本的字符点阵与模板的字符点阵进行匹配,计算两者之间的相似性。
(2)基于字符结构的识别方法
基于字符结构的识别方法的基本依据是利用字符本身的结构特征去跟模板完成逼近识别,不要求对待识别样本以及模板进行归一化,较之汉字的识别,比较适合数字和字母的识别。通常归一化操作会丢失有用的字符信息,略去归一化过程,既能提高识别速度,同时也能避免由归一化所造成的有用字符信息丢失。
(3)基于神经网络的识别方法
近几年,科学界陷入对神经网络的研究热中,神经网络因此飞速发展。基于神经网络的识别方法是一种比较前沿的识别方法,神经网络模拟了人类思文的部分机理,能较好地处理一些较为模糊的任务。使用人工神经网络进行字符识别之前,需要先对样本进行学习训练,一般训练时间较长,因此减少训练时间将成为神经网络发展的必然方向。如果训练集发生改变,需要进行扩充时,必须对网络进行重新训练,在这一点上,模板匹配方法就比较方便,模板库易于扩充。但如果网络的训练时间足够,训练的样本也足够合适,其识别率较之前两种方法而言要高[7]。 实时辨识各类瓷砖表面不同分拣标记的方法研究(3):http://www.youerw.com/zidonghua/lunwen_14217.html