③确定模型是针对隐式注意还是显式注意
从生物视觉的角度看,两者的区别在于注视点转移过程中有没有伴随眼运动。隐式注意时,眼球不会随着注视点的转移而移动,而显式注意时,眼球随每次注视点的转移而运动。在计算机模拟的视觉注意模型中,隐式注意中的采样依循采样中心固定不变,中央向外分辨率递减的方式;显式注意中,每次采样的采样中心不断变化,相比于隐式注意,计算量很大,而且目前对不同采样点所产生的结果如何交互的原理尚不清楚,因此,基于显式注意的视觉注意模型方面的进展比较小。
本文研究的是基于数据的,隐式的视觉注意模型。这种模型的核心任务有以下三个:
①初级视觉特征提取
首先确定从输入图像中提取哪些特征引导注意。研究表明初级视觉特征可以是一些基本的视觉特征,如颜色,朝向,亮度,深度等特征,也可以是特征的组合,甚至还可以是其它一些通过后天学习得到的特征,提取的特征根据具体图像而定。这些特征在此阶段是按并行方式在整个图像上进行计算,不同的特征对注意引导的作用依赖于它们在图像中的对比度。
②多特征图合并策略
该任务也被称为显著图生成策略。经过初级视觉特征提取,一些特征被计算出来,并利用这些计算结果来引导视觉注意。现有的模型几乎都是使用了Koch与Ullman提出的基于显著图(Saliency Map)或称主图(Master Map)的方式。显著图是在各个视觉初级特征文上形成的一幅二文“图像”,其中的每个像素值表示原图像对应点的显著度大小。如何融合多个视觉特征图形成总显著图,是一个模型的核心和关键之处。
③注意焦点转移机制
由显著图提取最大值点作为第一次注视点后,需要一个引导注意进行转移的机制,这涉及到注意焦点转移策略。认知实验揭示,注意焦点转移取决于两点:一是对当前注视点的提取结果;二是一旦某个物体被注视过,它的显著性会通过抑制机制被抑制。在现有大多数基于数据的注意模型中,认为一旦某个区域被注视过,则该区域显著性降为零,在以后的搜索中将不被列为查找范围。
基于媒体处理的视觉注意力研究始于20 世纪90 年代。在随后的二十年间,多种视觉注意力模型不断涌现,逐渐成为智能图像信号处理领域的研究热点。这些方法可以应用于多个领域,并提升传统方法的性能,包括内容感知的图像缩略图生成、自适应的图像/视频压缩、感兴趣对象分割、对象识别、对象跟踪、智能监控、智能图像重定位(retargeting)、图像分类、图像/视频检索与摘要等。目前普遍认为视觉注意力的驱动存在两种方式:自底向上(bottom-up)和自顶向下(top-down)。自底向上的视觉注意力受图像数据所驱动(data-driven):当视觉场景中的区域与周围区域存在足够的反差(或对比度)从而自动突现出来,吸引人们的注意力,这种感知特性称为显著性(saliency)。而自顶向下的视觉注意力受高层认知因素所驱动,与大脑的知识(knowledge)、期望(expectation)和当前视觉目标(current goal)有关,例如:汽车驾驶员会更多地关注路标。这种凭意志分配的注意力需要花费比自底向上注意力更长的时间(不少于200 毫秒)。总的来说,视觉场景中的某些特性会首先自动吸引注意力,这被称为视觉显著的(visual salient),而其后,将注意力导向到其他位置或对象,需要更主动的意愿。一般认为,两种机制并行进行,并结合在一起控制最终的注视行为。在过去二十年中,国内外研究者在不同学科领域提出了多种视觉注意力或视觉显著性检测的计算模型。这些模型要解决的问题是如何准确地预测视觉场景中能够吸引人眼注意的区域。其输出结果一般是一种被称为显著谱(saliency map)或注意主图(master map)的二文灰度图,图中越亮的部分表示越突出或越容易引起人眼注意的区域。 局部对比度的视觉注意模型国内外研究现状(2):http://www.youerw.com/yanjiu/lunwen_22307.html