而实际上,人们真正感兴趣的信息只占大量图像和视频数据中很少的一部分。那么如何从这些数据中快捷、准确地获取重要的且有用信息以用于分析和处理,已成为了智能媒体处理领域面临的新的重要挑战。图像显著性检测的任务就是要解决如何从海量图像数据中准确地找到人眼关注的重要区域或对象的问题。因此,对图像显著性模型理论与方法进行深入研究,对于提高媒体数据的获取、处理与传输效率,提升媒体处理与分析技术的水平,都具有非常重大和深远的意义。
人类每秒钟接收和处理的可视媒体数据(108-109比特)远远超过了计算机系统的处理能力。如果不是借助于一些“巧妙的”机制来减少数据处理量,要实时处理如此庞大的数据是不可能完成的。而视觉注意力(visual attention)正是人类和地球上的很多生物经过漫长的进化所获得的一种“巧妙的”处理机制。正如美国心理学之父——William James 所说,“每个人都知道注意力是什么”,注意力是如此自然和简单,以至于每个人、每只动物乃至每一只小昆虫都拥有视觉注意的能力。虽然所有人都“明白或者了解”注意力是什么,但19世纪之前,很少有人分析和研究视觉注意力。人们在面对一个复杂场景时,能够迅速选择性地找到“重要的”或“感兴趣的”区域,而忽略其他不重要的部分,这种认知能力称为视觉注意力。视觉注意力是生物为了能迅速地觉察到猎物或潜在的危险而进化形成的一种天生的能力。更重要的是,通过视觉注意力机制,视觉系统可以有选择地着重处理进入视野的海量信息中最重要的部分,从而打破大脑和视觉系统处理信息的瓶颈。这正是许多现代计算机系统正在等待解决的主要问题。
1.2 国内外研究现状与水平
1.3 发展趋势
1.4 本论文结构
第一章阐述了研究的背景和当前的研究状况,指出了当前研究的不足,本文所有研究内容均是基于MSR,MSD,MSRF三种方法进行探究,故二章将介绍图像检测的相关知识以及算法介绍。第三章详细地介绍了如果通过matlab实现三种方法的研究,包括对用户界面的实现、如何能够使得用户界面更加人性化、对算法的实现方法。
2 显著区域检测算法介绍
在绪论章节中,已经讨论了显著区域检测技术的国内外研究现状,本章将继续较为深入的介绍本文主要研究的几种算法,并简单对其优劣进行分析。
2.1 固定显著性的最小矩形方法(MRFS)
现有技术通常用矩形框标识出图像中的显著区域。微软亚洲研究院的Liu等人提出MRFS方法,采用遍历搜索机制,将包含有显著图95%显著点的矩形框视为最终的显著目标检测结果。
该方法可用如下公式概括表示:
W^*=〖arg〗_(W⊆I) min〖A(h(W))〗
h(W) ={W|(∑_((x,y)∈W)▒〖Sb(x,y)〗)/(∑_((x,y)∈I)▒〖Sb(x,y)〗)≥λ} (1)
其中A(h(W))表示h(W)区域的面积大小、S_b表示二进制图像S。我们设S_(b(x,y))=1当S_((x,y))≥τ以及当S_((x,y))<τ时设S_(b(x,y))=0。这里,τ是阈值,W是整个图像区域I的子窗口,λ是固定百分数。这个强力有效的算法并不是有时间效率和λ启发式决定的。
2.2 最大显著区域方法(MSR)
有学者提出将高效子窗口定位方法引入到显著区域检测中帮助其解决问题。该方法首先利用分类器将显著图中的所有像素分为两类:显著的和非显著的像素,然后求解显著检测目标问题便转换为求解矩形包围区域的最大分类分数问题。 基于视觉显著性的显著区域检测算法研究(2):http://www.youerw.com/jisuanji/lunwen_22297.html