由于图像有很多种类,而自动分割方法不能很好处理背景复杂的图像,因此通常需要增添人工交互,使用一些先验条件来辅助分割,根据分割过程中用户是否参与,我们将图像分割分为非交互式图像分割和交互式图像分割两种类型[13]。在非交互式图像分割方法中,不需要用户的参与,算法会自动完成给定图像的分割。而交互式分割则是需要用户交互操作,以在分割过程中融入所需的先验信息(如:初始轮廓、先验参数、种子标记等),从而能更加准确地提取出目标对象的轮廓。 28217
一般来说,我们可以将交互式图像分割分为两类:基于边界的方法和基于区域的方法。在基于边界的方法中,要求用户提供初始的轮廓,轮廓要接近想得到的分割边界,然后算法自动的驱动初始轮廓朝想得到的边界迭代。然而,基于边界的方法对初始化非常敏感,并且为了获得满意的分割结果,需要用户相当大的交互努力以指定初始轮廓。在基于区域的方法中,仅需要用户在图像上标记某些像素 作为前景和背景的种子,然后算法完成对所有其他像素的标记工作。作为一种典型的基于区域的交互式分割的例子,常规的图像分割方法[5]使用直方图来分析图像,在这种方法中,我们用一个加权图来代表一幅图像,然后分割就转化为了在图中找最小割的问题[6]。图1.2[5]显示了对一 图像的图像分割模型。左边显示的是图的构造,其中 和 是代表两个标签的终端;右边显示的是一个将图划分成两个集合的割,为连接到 的像素分配标签 ,为连接到 的像素分配标签 。论文网
图1.2 3×3图像的图像分割模型
由于直方图的局限性,图像分割很难分割彩色图像。Grabcut[7]扩展了图像分割的框架来处理彩色图像,它是通过开发一个优化的迭代版本实现的。由于在自然图像中有丰富的纹理信息,所以不考虑纹理信息的话很难得到满意的结果。为了解决这个问题,提出了许多基于颜色-纹理的方法[8,9],它们将颜色和纹理的信息结合起来考虑。尽管这些方法已经提高了自然图像的分割精度,如何设置它们的融合规则仍然是一个巨大的问题。
近年来,基于非局部的方法被在许多图像处理问题中广泛的使用,例如去噪、恢复和分割。在这些方法中,通常使用了图像片之间的相似性。在文献[10]中,非局部的信息首次引入到图像分割框架中,其中是计算图像片之间的相似性来代表非局部信息;在文献[8]中,我们也用图像片级的信息来表示像素间的距离。在这些方法中使用图像片可以使算法克服噪声,并能保存纹理信息。然而,它仍然存在以下问题。第一,常规形状对象中的图像片有相似的结构,而在不规则形状对象中,图像片可能有非常不同的结构。例如,在两级分割中,前景和背景都有多种结构,因此在图像片间获得准确的相似性很难。第二,对于图像中有稀少结构的像素,很容易将其错误分类,那是因为有高相似性像素的个数很少,而有低相似性的个数很多。在这种情况下,低相似性的权重数量很大,这将导致会用与他们相异的像素标签来标记这些像素。第三,尽管使用图像片来考虑了结构信息,细节特别是边界区域的细节不能够很好的保存。第四,像素片之间的比较带来了很大的开销。为了解决以上问题,提出了基于有限搜索区域[11]和阀值[10]的方法。在基于有限搜索区域的方法中,每个像素被分配到一个固定尺寸的搜索区域,并且只有搜索区域内的像素可以用来计算相似性。在基于阀值的方法中,只考虑相似性比阀值大的成对像素。尽管这些技术已经提高了基于非局部方法的性能和效率,搜索区域的大小和阀值仍然需要手动选择。如果搜索区域尺寸太小的话,基于有限搜索区域的方法会退化为基于局部的方法;而搜索区域尺寸太大的话,还会存在上面所说的问题。基于阀值的方法也是如此。 交互式图像分割研究现状:http://www.youerw.com/yanjiu/lunwen_22983.html