但由于 l0 范数是非凸函数并且不是全局可微,因此求解 l0 范数是一个非确定性多项式
(Non-deterministic Polynomial,NP)[8]难题,因此本文将采用 l1 范数最小化的凸优化算法来 逼近这个解。
l1 范数即向量中各个元素的绝对值之和,也成为稀疏规则算子(Lasso regularization)[9]。 之所以由 l1 范数实现稀疏,正是因为它是 l0 范数的最优凸近似,并且对其求解是凸优化问题, 求解过程可以转化为线性规划问题,比求解 l0 范数的最小化要简单得多:
式(2。1)即为目标函数的 l1 范数凸优化,在系数 x 足够稀疏的情况下,l0 范数最小化的
问题就可以等价于 l1 范数最小化的问题,对这个公式的使用将在下一章中介绍。
2。3 稀疏表示的特点
在稀疏表示过程中 l1 范数的引用完成了特征值的自动选择,它会在最小化目标函数的同 时去掉不具有价值的特征,即把这些特征对应的权值置零。值得一提的是,这些特征没有价 值的原因是在计算过程中它们并不能提供有用信息,它们虽然可以帮助获得较小的训练误差, 但在用于识别新样本的时候考虑到这些额外特征反而会干扰正常运算。在稀疏表示中,特征 值选取的精确程度并不重要,只要它们足够稀疏并且可以正确表示图像的分类信息,特征值 可以自动随机获取。来*自~优|尔^论:文+网www.youerw.com +QQ752018766*
稀疏表示所获得的模型更容易解读,这是因为在计算结束所获得的线性组合表示中,除 了那些与测试样本具有较高相似程度,即可以线性表示出测试样本的训练样本之外,剩余的 训练样本系数均为零。在当使用的数据维度非常高时,稀疏的优势非常明显,在去除系数为 零的样本后可以很快获得近似样本,从而得到近似程度最高的样本所在的类别。
遮挡的鲁棒性则更针对于图像的识别。遮挡造成干扰的主要原因是其引起的误差通常都 不可预测[10],也就是说这些误差在图像中影响的位置和范围都是不可知的,但是被遮挡的这 些区域的像素对全体的像素而言是稀疏的,这时将过完备的字典在训练样本的基础上加上误 差基向量扩展,再稀疏表示输入样本,就可以消除一定程度上遮挡带来的误差。
3 基于稀疏表示的人脸识别
与前文中提到的稀疏表示理论相同,基于稀疏表示的人脸识别也需要先利用训练样本构 造一个超完备的字典,如果每个类中的训练样本数量是足够的,就可以用字典元素线性表示 出测试样本,达到识别的目的。在最终得到的线性表示中,实际上只需要一个类中训练样本 的一部分就可以表示出测试样本,这种表示是自然稀疏的[11]。下面将从过完备字典的构造开 始介绍稀疏表示的人脸识别。