图像的显著性分析是基于视觉机制进行深入研究的,从计算流程上来分,可以分为两方面:自底向上和自顶向下。
1自底向上的显著性分析
自底向上不需要任何的先验知识,它是根据图像本身的信息对显著区域进行提取。从计算量方面来讲,自底向上的显著性分析所需要的计算量更小,它更多是利用图像基本、低等的生物特征来刺激人的视觉机制。视觉显著模型依据显著度的不同计算方法,可以分为空间域计算模型和频率域计算模型。78753
空间域的模型通过在空间域提取的图像颜色、形状、纹理等低层信息,来计算显著图。它一般可以分为3类:基于生理基础、基于信息论、基于区域分割和区域对比度。
最早提出‘显著性图’这一概念是在上世纪八九十年代,由Koch和Unman[3]提出的。它选取某种图像描述作为度量显著性的先验模型,以生物视觉系统中的一点或者几点现象为基础,用信息论知识或统计学习理论作为桥梁,来进行计算和推理。
基于生物感知的显著性研究,是在90年代末期兴起的。这类方法在自底向上模型机制的影响下,根据人类生理学、心理学、Visualattention机制的理论知识,将显著性模型建立在人眼视觉关注的模型上,从而获得了多种低级视觉特征。论文网
Itti等人[4]研究了一种基于生物启发模型和特征集成理论的显著计算方法[5]。该方法计算了多尺度图像特征的中心周边差,然后线性组合多个特征对比图,进而得到最终的显著图。Center-surround在模拟人类视觉选择系统的特点上有着很好的表现。之后很多的自底向上模型均是在此模型的基础上对图像进行局部处理,得到显著图。
随着研究的深入,基于生物特征的模型的局限性越来越大。同时,人们发现,图像中目标和背景的差异可以归结为是基于对比度的。基于局部对比度的显著性分析方法应运而生。该方法有三种分类:显著性点、显著性区域、显著性视图。点就是图像中的像素,将点分为
显著性点和非显著性点。所谓显著性点就是容易受到人们关注的点。但是这一方法容易噪音像素的影响,而且很难利用先验知识和高级视觉特征。显著性区域就是显著对象,它不必拘泥于每个像素,减小了计算量并且能够忽略图像中不必要的细节。目前,显著性区域应用得较多。
在Itti模型的基础上,Harel等人[6]提出了一种新的视觉显著性检测算法:基于图结构的算法(GBVS)[7]。该方法用有向完全图来表示图像,图像的像素是有向图中的结点。首先提取每个结点的特征,并计算任意两个结点特征之间的差异。完全图中边的权重,是通过结点之间特征的差异来反映的,被定义为转移概率。该方法中图像位置的显著度是通过聚集时间的长短来反映的:在随机游走的过程中,和周围顶点之间差异较大的顶点将聚集更多的时间。由位置的显著性最终获得整幅图像的显著性。
基于频域的模型主要是利用离散傅立叶变换完成图像从空间域频域的转换,并计算频域上图像的相位谱和振幅谱。对振幅谱和相位谱进行分析,提取显著信息,再通过傅立叶反变换道空间域进行后续,处理得到最终的显著图。
从频域的角度分析,Achanta等人[8]提出了一种基于频率调整的算法。首先对输入图像进行高斯滤波,然后计算每个像素的显著值,进而生成整个图像的显著图。每个像素的显著值是用该像素与整个图像的颜色平均值的差获得的。
典型的频域算法有基于谱残差的检测算法,该算法将图像的信息看作是新颖信息和固有信息。新颖信息视为图像的显著信息,固有信息是图像的平均振幅谱。将图像的振幅谱信息减去固有信息就是谱残差。结合谱残差和相位信息,进行傅立叶反变换到空间域得到的就是自然图像的显著图。 图像的显著性分析技术国内外研究现状:http://www.youerw.com/yanjiu/lunwen_90831.html