第一章 绪论
1。1研究背景与研究意义
1。1。1研究背景
在信息日益数字化的当今社会,计算机在人们的日常生活、工业应用、科学研究等方面起了越来越重要的作用,更多人开始用计算机来处理和存储数据。以往人们人工操作将数据输入电脑,这种行为不仅浪费时间,且容易出错,影响数据的正确率和工作效率,随着计算机处理信息能力和水平的不断提高,越来越多的领域需要将大量的手写体和印刷体信息输入计算机,来分析和处理相关数据。
光学字符识别(OCR,Optical Character Recognition),指的是将书本、报刊、手稿等印刷品或手写体的扫描体图文信息转化为可以被计算机识别和处理的文本信息[1]。经过了近百年的发展,OCR在模式识别领域占有着不可替代的位置,并对图像处理、计算机视觉、形态处理等的发展做出了伟大贡献。它有效地缓解了低速的输入与高速的信息处理之间的矛盾,提高了整个系统的工作效率,同时也提高了各个领域的工作效益。
OCR技术通常由手写体OCR识别技术和印刷体OCR识别技术两种组成,而前者又包括联机识别技术与脱机识别技术。一般地,手写体字符识别的难度比印刷体字符识别的难度大,但其实用性和应用范围远远不及印刷体字符识别,如人民币冠字号、支票打印字符、银行票据和车牌字符等识别都需要用到印刷体字符识别技术[2]。图1-1为OCR系统的分类。
图1-1 OCR系统的分类
在实际应用领域,造成字符质量低下的主要原因有:采集设备分辨率较低、设备晃动、拍照角度倾斜或光照不均匀;被采集对象背景复杂、自身存在损坏、排版错乱;被采集对象运动而造成模糊,等等。
日常生活中会产生许多低质量的印刷体,如办公室中的传真与复印造成的文本材料的质量低下,图书资料上传过程中所产生的低质量文本,财务税务的发票、支票出于防伪目的使得背景过于复杂等,这些低质量印刷体会对人们的工作、生活产生影响,我们需要对其处理,将它转换为可以利用的信息。
1。1。2 研究意义
大量研究的实验结果表明,字符识别技术对高质量的印刷体单字的识别率可到达95%,但针对低质量印刷体字符的识别效果并不是很好,其原因大多是字符的分割不准确和字符识别错误。为了让字符识别技术更好地识别低质量的印刷体,使得字符识别技术更好地为人类的工作、生活服务,从发展和应用角度来看,低质量印刷体字符识别技术的研究意义重大,其意义主要表现在以下两个方面:
(1)可以为人工智能、图像处理、信息论、模式识别等领域提供更好的借鉴参考。基于OCR技术经常用在低质量文本图像的识别问题上,低质量、高噪音下的正确识别率问题一直是研究的热点难点,研究对象可以不同,但是原理是相通一致的。论文网
(2)低质量印刷体文本的识别问题可以直接推广和应用到车牌识别、商标及广告文字识别等实际应用领域,对英文和数字的识别问题存在很大的类似性。并且由于汉字库的多样性,文字识别问题是多类模拟集合的问题,对OCR技术的研究可以分析研究各种方法的优缺点,为新理论的有效性提供较好的验证。
1。2国内外研究现状
1。2。1 OCR技术的发展历史
1。2。2 OCR相关技术的研究现状
1。2。3 OCR技术的研究难点
1。3本论文的主要研究内容
车牌字符图像是典型的印刷体字符图像,本文以车牌字符图像作为主要的研究对象,在尽可能地考虑了低质量印刷体在系统各环节存在的种种问题的基础上,设计了一个低质量印刷体字符识别系统,以便提高整个识别过程的准确度。