MATLAB基于稀疏表示的人脸识别算法实现(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

MATLAB基于稀疏表示的人脸识别算法实现(4)

a b c d

图 2。1 稀疏表示分类概览

图 2。1 简要概括了稀疏表示分类方法。图 2。1a 是一张测试图片,它可能是被遮挡的,将 它由图 2。1c 所有训练图片的线性组合来表示,得到如图 2。1c 所示的组合系数,其中红(深) 色系数对应的就是识别出的正确的类别。由于遮挡的存在,系数组合中加上了图 2。1d 中由遮 挡造成的误差。

SRC 算法是一种具有较高鲁棒性的人脸识别算法,这是因为将原始图像进行一定程度上 的压缩处理后所获取的特征值反而更好。Wright 等人[4]提出了 SRC 算法并依此编写了稀疏表 示分类器,在对多种变化条件下的人脸图片进行测试后成功实现了较高鲁棒性的人脸识别。

2。1 稀疏表示基本概念

在图像、声音等信号处理领域的早期研究中,为了尽可能多地利用信息,往往尽量充分 地使用测试的样本所包含的大量数据。但随着信息采集设备的发展,需要处理的信息量越来 越大,这时候推理理论中非常重要的简约原则逐渐应用在信号表示上,在选取特征值时更偏 向于选取小量的子集,而不是直接运用输入数据来进行表示或者分类。这种简约的思想实际 上就是一种稀疏表示的概念。

稀疏表示是一种基于最小化范数来进行优化的方法,其最初目的是用比香农定力更低的 采样率来表示和压缩信号[5],也就是在给定的超完备字典中用尽可能少的原子量来表示信号, 获得信号更为简洁的表示方式,从而更容易地获取信号中所蕴含的信息,更方便进一步对信 号进行加工处理。原始人脸图像的维数通常都比较高,如果直接对其进行分析将消耗大量的

计算机硬件资源,并且会使算法的复杂度提高[6],而原始人脸高维图像的子空间各个像素点之 间具有较强的相关性,利用这个特点来对图像进行降维处理和特征值提取,再通过线性组合 将得到的原子数据逼近原始图像数据。如果这些原子数据足够稀疏,就可以进行凸最优计算, 从而转化成一种可解或可求近似解的数学问题,即求解稀疏线性方程 y=Aα 中的稀疏解 α。

由求解线性方程引出稀疏表示中最重要也是最基础数学问题实际上就是求解 l0 范数的问 题,这是与稀疏表示的来源思想——压缩感知理论是相同的。压缩感知理论是一种采样理论, 它利用了信号的稀疏性,用随机采样获取信号的离散样本,然后通过非线性重建算法重建信 号[7]。文献综述

稀疏表示理论自提出之后就在信号学领域吸引了很多关注,很大程度上是因样本数据满 足稀疏条件时展现出之前算法无法体现的优势,比如特征值的自动选择、易于解读的模型以 及应对遮挡的鲁棒性等等。

2。2 L0 范数最小化问题

在给出一个测试样本后,要解决的一个重要的问题是求解它在数据库样本上的稀疏表示。 例如用稀疏表示的方法在训练样本数为 1000 的数据库中进行识别,那就需要对 1000 维的训 练数据建立回归模型 y=w1*x1+w2*x2++w1000*x1000+b,假设在训练之后只有 5 个非零的 w, 那么这 5 个训练样本都与测试样本有关,可以通过比较 w 的大小来进一步获得相似度;如果 1000 个 w 都不为零,那么训练样本本身互相相似或者测试样本具有一定的普遍性,需要采取 一定的方法进行进一步的比较。这就将一个抽象问题转化成的数学问题,并且是一个欠定的 线性方程求解问题,而通常情况下欠定线性方程是没有唯一解的,只能通过加上其他的条件 来缩小解的范围,比如加上 l2 范数最小化的条件,则方程就可以得到唯一的最小范数。l2 范 数是能量的度量单位,它是用来度量重构误差的,对稀疏表示求解的帮助不大,而若将 l0 范 数作为条件,则会实现数据的稀疏性,即要求方程的解具有最小数目的非零项。 (责任编辑:qin)