手写体数字识别得益于神经网络和模糊逻辑技术的发展,很多研究这一问题的方法应运而出,与此同时更是向陈旧的课题注入了新鲜的血液。
当前模式识别存在着很多问题:输入样本表达的选择、分类器的选择、采集数据、处理数据、选择数据和样本集对识别器的有素的训练。手写体数字识别正是应用了人工神经网络这一方法,才有了很大的进步。因为神经网络具有推广能力、记忆力、非线性和自学习能力以及高速运算能力的特点。
虽然当前世界上很多科学家已经在手写体数字识别上做出了很多努力并且取得了很大进步,识别率基本不会低于96%。但是手写体数字识别技术还存在若干问题,依旧是文字识别中的难点之一。
本毕业设计重点解决以图像方式存在的数字识别问题。整体分为三个部分:图像预处理、结构特征的提取,设计神经网络并对前面得到的样本数据进行学习和训练。本设计通过MATLAB进行仿真,神经稀疏编码网络应用在手写体数字识别中能够得到比较好的识别率。
1. 手写体数字识别其预处理
1.1 手写体数字识别的基本方法
科学家对于数字识别问题的研究已经很久了。但是从开始研究到现在科学家还没有取得所期待的结果,原因包括方方面面源!自`优尔~文)论(文]网[www.youerw.com。比如说对于人的视觉认知的研究才刚刚起步,对于满足我们的期望要求还是有很长的路要走;我们都知道人的脑袋的处理能力比起计算机的处理能力是要强很多的而且人脑对于信息的存储能力也是要比计算机的存储能力也要强的多[3]。总的来说,我们手写体数字识别目前只有在理论上去模拟,其中存在的问题虽然不太难但是却有实际应用。
数字只有十个,说白了对于识别的问题可以当作非常简单的分类问题。但是随着研究的深入,对于新的算法却成出不穷。方法虽然多了但是误识率与识别率和所期待的还有很大的差距。原因很简单,世界上的人各种各样,不同性格不同职业受过不同教育的人他们对于阿拉伯数字的书写有很大差别,具体说有两个:第一是0至9写法都很简单,他们之间的差别不是太大,要想精准而快速的识别出来难度很大;第二是每个不同的人因为不同的原因书写的数字也不同,就是没有一个标准。最重要的是有的人习惯的去连笔写,有的还喜欢简写,所以大大增加了识别的难度。比如说一个专家医生,写数字无数次,有时为了赶时间他不可能一笔一划的去规范的去写,这就出现了识别难度剧增的问题[4]。