第二章 数字识别技术:有条理的对数字识别进行了详细的说明,目的是为MATLAB设计埋伏笔。
第三章 神经网络原理介绍:本章对神经网络的基本知识进行介绍并简述其工作原理。
第四章 基于MATLAB的设计与系统实现:本章是以上几章的理论为指导,设计一款数字识别系统,并且具有人机互动的功能。
第五章 总结与展望:对本次设计过程进行了总结,并对未来的研究方向进行了深度的思考。
基于论文的大纲和研究方向,在本次毕业设计中,所作的主要工作如下所示:
(1)阅读大量有关数字识别技术的中英文文献,并研究数字识别系统的设计原理;
(2)阅读大量有关MATLAB关于数字识别方式的设计方面的书籍,了解各种数字识别技术的算法和过程;
(3)通过对手写体数字识别技术的深入研究和分析,了解它的优缺点和各自的适用场合。
2 数字识别的基本方法
在数字识别系统中,传统的处理过程是首先对图像进行预处理,得到一个二进制矩阵,然后对此矩阵进行特征提取和数字识别,在特征提取中为了得到一个较好的识别效果,我们要进行神经网络的学习与训练,本章将对这些技术进行简要的说明。
2.1 图像预处理技术
望文生义,图像预处理的意思就是在进行图像识别之前,对即将被识别的图像进行特点的采集、切割和匹配。其首要意图是去杂扩实,提高信息的可探测性,尽最大的努力对数据进行简单化。在该过程中, 一般会用到数字化、归一化、几何变换、复原和增等步骤。作为对图像处理的先提条件,要想对一个图像进行处理或者识别,必先要把它的原始图像转换成处理软件所需的二进制形式,从而对二进制数进行处理。 手写体数字图像预处理的过程,要经过几个步骤,且根据不同的应用,有些系统可能不需要这么复杂,针对本次设计对图像的预处理过程主要有二值化和细化两个技术。
2.1.1 二值化处理
图像的二值化处理,就是把原始图像中的每个像素区别成0和255两种色素,通俗来说就是黑色和白色这两种颜色。在这个过程中,最重要的就是对数字字符图像二值化后,还要能准确的还原原数字,总之根本要求就是字符中不能出现断裂,只有达到这样的要求,二值化后的字符才能保持原有的图像特征,不至于紊乱。
在这项技术中,每个步骤都至关重要,但是其中之最莫过于对与阈值的选择上。对图像二值化的技术方法各种各样,像整体阈值法就是其中算法比较成熟的一种,且应用的也很宽阔。这几种方法根据实际应用的不同进行选择,可以通过计算机选择或者人工选择。
在数字识别中的预处理过程中,可以采用双峰法进行二值化处理,是因为通过字符识别扫描后得到的图像和背景的灰度级一般会有明显不同。这种方法属于整体阈值的一种,采取这类算法时计算简便,运算量小,容易在计算机中实现。当然还有一种情况,就是当图像和背景之间的灰度级差异特别明显的时候,我们可以惊奇的发现,它的灰度直方图就会呈现双峰状图形,而且恰巧目标图像和背景与两个波峰有呼应,并且图像边缘与其波谷呈现相对的状态,此时在谷底仔细寻找,若发现分割阈值的话,正是采用图像分割能得到的最完美结果。
2.1.2 滤波
在数字图像的形成、传输、获取过程中,不可避免的会产生噪声,导致实际接受的图像受损、模糊,对正常的信号产生干扰,影响人们信息的获取。噪声的产生是随机的、不可避免的,数字图像中的噪声产生的原因主要有光电转换过程中产生的随机噪声、模数转换过程中的量化噪声、在信道传输过程中产生的随机噪声。生活中常见的数字图像中的噪声有电视机图像上的雪花点,当电视的接收信号不稳定的时候,就会产生雪花点,接收信号严重不稳定时,图像还会扭曲、变形、模糊,严重影响人们的收视效果。文献综述 MATLAB数字识别系统的开发研究(3):http://www.youerw.com/zidonghua/lunwen_80493.html