大多数自然图像都蕴含了非常丰富的局部结构信息,因此我们考虑将单张图像分解成一连串带有不同结构信息的子图像,每张子图像包含了原图像的一部分结构信息,比如方向信息。基于这个理念,钱建军[22]提出了基于局部结构特征的图像分解方法(IDLS)。IDLS通过描述宏像素(marco-pixel)周邻域宏像素的关系来得到图像的局部构造信息。这里用来刻画宏像素之间关系的方法是脊回归(Ridge Regression)。这时,对于每一个像素我们都得到了一个N维的特征向量,一张图像便可以被分解成为N个子图像。然后对所有子图像进行降采样并且规一化为一个单位向量。归一化后的子图像级联成一个超向量(super-vector)。然后使用FLDA对超向量降维,得到一个紧致的低维特征向量(feature)。
IDLS中使用了回归的方法来刻画宏像素之间的关系。近年来,线性回归(Linear Regression)在人脸识别领域是一个比较热门的主题[23]。为了抑制过拟合的产生,我们通常在线性回归模型后上加上一个正则项,用于限制模型的复杂度。最常见的正则项为L2范数正则项(脊回归 Ridge Regression)和L1范数正则项(Lasso回归)。线性回归、脊回归、和Lasso回归都是一维的模型。这些一维的模型有两个主要的缺陷。第一,这些模型假设残差项符合统计一一上的独立同分布。这个假设只对随机噪声成立,对于带有结构信息的遮挡则不成立。第二,将二维的图像拉成了一维的向量之后,图像原有的结构信息就不能被有效的利用。为了解决这两个缺陷,杨健[24]提出了基于核范数的矩阵回归模型(NMR)。NMR充分利用了结构性噪声(如块状遮挡、墨镜、围巾遮挡等)的低秩特性来消除噪声,同时也保留了二维图像的结构信息。与脊回归相比,NMR有以下几个优点:(1)在消除光照变化对图像产生的影响时,核范数比L1范数和L2范数更加稳健。(2)在消除结构性噪声时,低秩假设比稀疏假设更加符合直观经验。(3)NMR不依赖于“像素值独立同分布”的假设。将NMR替换IDLS中的脊回归,可以给IDLS带来更加理想的性能。在本次毕业设计中拟使用NMR来替换IDLS中的脊回归,构建出更加稳健的基于NMR图像分解的特征表示方法(NMR-IDLS)。
1.3 后续内容安排
后面各章节的内容安排如下:第二章在介绍了NMR和IDLS模型的基础上,提出了NMR-IDLS模型;第三章将NMR-IDLS模型扩展至有监督学习的版本,并介绍了它与卷积神经网络的结合和反向传播算法。第四章给出了一系列实验结果和分析。
基于NMR图像分解的特征表示方法(3):http://www.youerw.com/jisuanji/lunwen_42930.html