MATLAB手写体字符图像识别算法研究(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

MATLAB手写体字符图像识别算法研究(2)

模式识别有很多种类,字符识别是其中的一个传统种类。自二十世纪五十年代起,许许多多的专家们开始了大量的研究,在模式识别方面引起了巨大的反响并推动了发展进度。在专家们数十年的探索中,他们想到了很多的方法来研究模式识别。专家们提出的方法能总结为两大类,其依据是使用的特征不一样,其中一个是基于结构特征,另外一个是基于统计特征。结构方面主要有圆、笔划、端点以及交叉点,而统计方面主要有点密度的测量和特征区域。总体上来说,这两种特征都拥有各自的优点。比如,针对统计特征的神经网络比较容易训练,而且针对统计特征的神经网络,在类似于MNIST数据集上,可以获得很高的识别概率。相对的,结构特征的优点主要在于可以概括字符结构,在识别中可以在几何和结构的特点合二为一,也能够获得很高的识别概率。

人工神经网络优点明显,自学能力强,适应性能力强,分类能力出众,容错率高,识别速度快,所以受到广大研究者们的重点关注,应用在字符识别中也得到了广泛的推广[3]。本文在研究手写体字符识别的过程中,选用了概率神经网络,并使用了错误字符再识别的方法来提高字符的识别率。MNIST数据库数据的使用,很好的证明了当使用自主学习错误的识别方法后,能够获得较高的识别率。

1。2 课题的意义和目的

社会在进步,信息时代也踏进了人类社会中,信息产业的迅猛发展必定对民族、国家和人类文明产生积极的影响。所以,整个世界都将自己的目光投到了信息展业上,并开始对其给与重视。社会在向前进步,给人类社会带来了无数信息的沉淀,计算机的孕育而生,为人类社会对这些信息的解决带来了处理方法。可是,技术发展迅速的另一面,拦路虎也出现在了人类的眼前,计算机网络传输内容迅速,处理内容高效,可是内容的录入却十分漫长,这两样构成的拦路虎也变成了困难。当今社会,还有大量的信息停留在书面上的文字图像,把大量的信息录进计算机是一个任重而道远的事情,因其步骤麻烦,效率低下,而在另一方面拉慢了当今社会的进程。所以,数据录入本是基础,却变为计算机应用中的一大难题。人们接收信息最多的是通过视觉。在生活中,人们接受大量的信息,其中视觉信息占大概百分之八十左右,这就意味着文字信息在人类的生活中越来越需要受到关注,类似于书本文献的翻阅,表格的总结,函件的检验。

在处理这些文字信息的同时,首先要做的是使用计算机进行字符识别,然后才能解决这些信息。

本文主要研究手写体数字,即0~9手写体数字,使用神经网络来识别。人工神经网络优点明显,自学能力强,适应性能力强,分类能力出众,容错率高,识别速度快,所以受到广大研究者们的重点关注,应用在字符识别中也得到了广泛的推广。本文在钻研手写体数字识别的过程中,选用了概率神经网络,并使用了错误字符再识别的方法来提高字符的识别率。通过使用MNIST数据库的数据,很好的证明了当使用自主学习错误的识别方法后,能够获得较高的识别率。

手写体数字识别作为图像识别的一个重要组成部分,其原理就是运用计算机来辨别手写在书本上的字符0~9,它也是光学字符识别的一个重要组成部分,是传统识别模式。其研究方向就是怎么使用计算机识别手写体字符0~9。它一共有两类,第一类是脱机,另外一类是联机。当今社会,金融市场逐渐变大,市场里的发票业务也充斥在各种工作当中,所以发票数量也变大越来越多。脱机手写体数字识别在金融市场的需求越来越大,比如各种银行支票,公司账单,个人发票都必须解决很多数字信息输入的问题,基本上都要靠着数据信息的录入。在很长的一段时间内,票据的处理任务由于解决方法的不合理,导致各种发票的处理流程需要动用很多的劳动力和资源,除此以外,处理后的后续工作也需要动用极多的劳动力和资源。倘若我们可以有效地利用手写体字符识别技术来完成票据信息的输入,这不仅提高了传统人工解决方法的效率,减少了成本,减少了我们的工作量,对提高时效性也起了巨大的作用。 (责任编辑:qin)