本次我的实验设计是基于图像和文字这两个看似非常普通的基本数据来进行,为了使设计的直观性和操作性可以大大提高,我选择matlab2012a来处理图像和文字,研究并从图像中检测出文字区域。
2 分析
图像中文字区域检测提取技术是技术内容图像处理的一部分,它主要以图像中的文字作为主体,通过分析图像中的文字特征,分割出图像中的文字区域。在做这次毕业设计前,我进行了大量资料的阅读最后决定用图像灰度化文字区域检测提取。
2.1 基于图像内容特征描述
2.1.1 颜色特征
颜色特征是图像最基本、最直观、最明显的特征,一般用直方图描述。直方图的横轴表示颜色等级,纵轴表示某一个颜色等级上具有该颜色的像素在整幅图像中所占的比例。相对其它视觉而言,颜色特征稳定性较好。具有旋转、平移、尺度不敏感特征。
颜色特征是一种全局特征,描述了图像或者区域的表面性质。
颜色特征是一种基于像素点的特征。
颜色特征的缺陷在于不能很好地描述对象的局部特征。
2.1.2 纹理特征
纹理特征是图像中一个重要而又描述难度较大的特征。很多图像局部呈现不规则性,而整体呈现规律性,这种特性称之为纹理。纹理用于描述区域中像素灰度级的空间分布特征,是与物体表面材质有关的图像内在特征。
纹理特征是一种全局特征,它描述了图像或者图像区域所对应的景物的表面性质,包括表面组织结构及其与周围环境关系的许多重要信息,但是,纹理不能单纯的由颜色或者密度得到,它不能反映出事物的本质属性,仅仅利用纹理特征无法获得图像的层次内容。
和颜色特征相比,纹理是图像局域像素点的特征,它需要包含多个像素点的区域内进行统计计算。所以,纹理是一种统计特征,具有旋转不变性,并且具有较强的抗噪音能力。
从人类的感知经验出发,纹理特征主要有粗糙性,方向性和对比度。纹理分析方法,大致可分为统计方法和结构方法两类。
纹理特征的主要缺陷在于受图像的分辨率影响很大,同时也受光照、反射的影响。
2.1.3 形状特征
形状特征是图像中的显著特征,是图像中的核心特征之一,也是人类视觉系统识别物体时所关键信息之一。同一物体可能有各种不同的颜色,但其形状总是相似的,因此形状是物体较稳定的特征。
封闭的形状具有许多特征,如形状的拐点、重心、各阶距,以及形状所包含的面积与周长比、长短轴比等。对于复杂的形状,还有孔洞数及各目标间的几何关系等。形状特征还包括其矩阵表示及矢量特征、骨架特征等等。
形状特征的缺陷在于缺乏比较完善的数学模型,目标物体发生变形是形状特征不可靠。 图像中文字区域检测算法研究(4):http://www.youerw.com/jisuanji/lunwen_16880.html