数字抠图技术主要分为蓝屏抠图和自然图像抠图[4],此外还有环境抠图、阴影抠图和视频抠图3种扩展和应用。抠图和图像合成是互逆的基本操作。抠图与图像合成技术起源于19世纪50年代,经历了数字和光学两大阶段。从20世纪80年代开始,数字抠图方法逐渐取代了光学抠图方法。如今,数字抠图与图像合成技术在各个相应的应用领域中占据了主导地位。最初蓝屏抠图出现于20世纪60年代,对背景有着严格的限制,使用起来有一定的局限性,且很不方便。因此如何在复杂的自然图像条件下,准确地抽取所需要的部分一直是研究的的难点和热点。随后在2000年出现的自然抠图技术因不对图像的背景做限制,应用起来很便利,受到了广泛的关注,并得到了迅速的发展。自然图像抠图技术主要由用户手工动输入信息,指定前景目标和背景目标,然后利用这些提示信息以及假定的图像统计分布特性,来建立抠图模型以求解掩像模型,最后通过掩像图将前景目标从背景中抽取出来。近年来,不少研究人员对自然图像抠图技术进行了深入的研究与分析,提出了各种各样的自然图像抠图算法。常见的算法有Chuang方法,Knockout方法,GrabCut方法,Lazy snapping方法以及基于感知色彩空间的快速抠图算法。
1.2 理论基础及问题定义
数字抠图大致经历了3个发展过程。1977年 Alvy Ray Smith 和 Ed Catmull 为剪影图像提出了alpha通道的概念,因为剪影与α值在经典的线性插值公式αa + (1-α)b中的作用是相同的。他们还提出了整数α的概念,即α作为整数用在图像中,反映像素点的前景和背景的透明度。1980年,Bruce Wallace 和 MarcLevoy 提出了如何用α混合部分透明的图像来完成图像合成,使图像合成技术变得让人神往。1984年Porter和Duff首次在数学意义上定义了抠图问题,将α通道的概念引入到抠图技术中,当需要将前景物体放入到一副任意的背景图像中时,用α通道来控制前、背景颜色的线性内插从而达到防止图像失真的目的。他们提出:任意一幅观测图像I可以分解成一幅前景图像F和一幅背景图像B在通道α下的线性组合:
I=αF+(1-α)B (1.1)
式中α为实数,是前景F和背景B的合成系数,也是前景F的透明度,取值范围为[0,1],当α=0时,图像中α所对应图像属于绝对背景;当α=1 时,图像中α所对应的像素属于绝对前景。在自然图像中的绝大多数区域都属于绝对前景或者绝对背景,然而在半透明物体或毛绒的前景边缘,在图像的离散化过程中会造成非连续性、运动或光照带来的模糊,此时的α值介到0到1之间,该像素的前景与背景混合,可称为“混合像素”。这个合成公式的提出标志着数字抠图技术的正式诞生。
对于彩色图像I, 需要为每个像素IZ估计前景色、背景色以及前景不透明度. 已知该像素的颜色CZ, 若采用RGB 颜色空间表示, 则CZ, FZ, Bz均为三维向量, 对于式(1) 可得出3 个方程:
CR =αFR+(1-α)BR (1.2)
CG =αFG+(1-α)BG (1.3)
CB =αFB+(1-α)BB (1.4)
对于灰度图像,C上的每个点有1个方程,3个未知量F,B 和a;对于彩色图像,每个点则有3个方程和7个未知变量。显然,这是不定方程,即欠约束问题。 这类问题本质上是不可精确求解的问题。抠图问题的这种严重欠约束性,使得精确求解变得非常困难。因此,我们需要增加一些额外的约束条件,或充分利用现有的图像中的信息,这样才有可能以近似的方式来求解。这真是所有现有的抠图算法的核心所在。这些算法一般需要用户输入适当的提示信息,对图像的局部特征进行假设,在大多数条件下这些假设是可以成立的,比如局部颜色平滑假设,局部颜色概率分布一致假设等,在这些假设下,再根据用户提供的额外信息,就能有效地降低方程中的变量个数,从而达到求解的目的。在媒体制作中,经常把前景物体放在一幅已知的背景图像前面拍照,即BR,BG和BB已知,从而把未知量的个数缩减为4个,但未知量个数仍然大于方程个数,抠图问题仍然不可精确求解。我们把B已知的抠图技术叫蓝屏抠图.相应地,背景任意的抠图技术叫自然图像抠图。[4] 自然图像抠图技术与软件实现(3):http://www.youerw.com/jisuanji/lunwen_71768.html