第一章 绪论
1。1 研究背景与意义
人脸识别是利用计算机分析人脸图像,提取出人脸信息并进行相应的身份识 别的一项技术。目前主要应用于智能监控、表情分析、门禁系统、人机交互等。 人脸识别主要包括人脸搜索和特征点定位两部分组成,即首先判断图像中是否存 在人脸,若存在则将人脸部分提取出来,并判断其特征。文献综述
伴随着十九世纪末计算机运算能力的提高,以及信息大爆炸,神经网络开始 得到重视,因为其能够自动的从信息中提取特征。最早将神经网络用于人脸识别 的是 Kohonen,Kohonen 于 1988 年提出了一种利用网络的联想能力来识别人脸 [1]的方法。随后又有好多人提出了不同的神经网络结构用于人脸识别,比如 Lin 等人在 1997 年提出了用于眼睛定位和人脸识别的径向基函数网络[2] 。
2006 年以后,随着深度学习的兴起和受限的波尔兹曼机(RBM)[3]的提出, 深度学习与神经网络相结合的深度信念网络也成为国内外研究机构的研究热点, 如 Google 公司开发的一款围棋人工智能程序 alphaGo[4]就是利用对多层神经网络 的训练调整神经网络的权重,模拟人脑的学习过程来学习围棋。但是目前神经网 络在人脸识别领域一般是采用特征脸信息,或者直接的图片输入,这样处理的信 息量就会很大,神经网络的性能也会出现下降。本文提出的利用局部二值模式提 取出来的纹理信息作为深度信念网络的输入可以去除不必要的数据处理,提高深 度信念网络的运行效率。局部二值模式提取人脸特征的速度也是众多算法中比较 快的一种,因此本文算法可以应用于实际的门禁系统、支付系统中,实现高安全 度的身份验证。
1。2 国内外研究现状
1。2。1 人脸检测与定位技术概述
1。2。2 人脸的检测与定位方法
1。2。3 人脸识别的方法概述
1。3 本文主要研究内容
本文主要研究的是利用局部二值模式提取人脸纹理信息再用深度信念网络 进行特征的提取与分类。本文人脸识别的全过程包括:人脸检测、人脸图片的裁 剪与归一化、局部二值模式提取人脸纹理信息、深度信念网络提取纹理信息中的 特征并进行匹配。
人脸检测决定了人脸识别的识别正确率,也关系到整个算法的识别速度。本 文中采用的是肤色检测与模板匹配相结合的方法,这是在对上文介绍的几种经典 的人脸检测算法进行研究后得到的,先利用肤色检测来确定人脸的大致区域,再 利用嘴模板验证人脸所在区域,最后得到人脸。该方法提高了检测的速度也保证 了检测的正确率。
人脸的裁剪主要是为了去除背景对人脸识别的干扰,减少了一些不必要的图 片信息。本文利用人脸检测得到的人脸位置信息来确定一个矩形的区域,保证矩 形区域内包含整张人脸。这样就可以去除背景的干扰,提高识别的速度和准确率。来:自[优E尔L论W文W网www.youerw.com +QQ752018766-
利用局部二值模式提取人脸的纹理信息,本文采用人脸的纹理信息作为人脸 的特征。算法中要考虑到采用何种局部二值模式,以及模式需要取多大的半径多少采样点来确保识别的正确率,这些都是本文所需要研究的。本文首先提取出人 脸的纹理特征,然后将这些特征作为深度学习网络的输入来训练神经网络,并在 DBN 的顶层实现对人脸的分类。之所以使用 LBP 算子因为 LBP 所提取的人脸 图像的特征对光照和图像偏移等元素具有将强的顽健性,而将其作为 DBN 输入 特征有利于神经网络理解图像特征分布,减少深度学习中无关的特征的影响。通 过在 Olivetti Research Laboratory(ORL)数据库上的实验结果表明该方法对光照、 姿态等因素具有较强的鲁棒性,能够有效地表示非限制条件下人脸图像的特征信 息,并且可以对人脸特征进行准确的预测。同时在扩展的 ORL 人脸库上,该方 法也保持了较高的识别率,这表明基于 LBP 算子的 DBN 网络能够有效地提取出 人脸的特征信息,并进行有效地识别。本文还研究了深度信念网络中隐藏层单元 数对识别正确率的影响,并试图找到合适的隐藏层单元数。