C++人脸识别系统(论文+算法+英文文献翻译+源代码) 第3页
图3 。1-D中的基于窗口评估。Fk0表示一个窗口居中于位置k0,c(.)是一个积分函数。它输出一连串连续值,正值表示该目标存在,而负值则表示目标不存在 ,c[k0]表示输出窗口在位置k0。
在该部分我们描述一个可供选择的“基于中心”评估策略,这些方法共享重叠窗口之间的特征值。第一步通过图中的长方形格子来计算特征值:
F[k0]表示对位置k0进行特征评估。
第二步使用窗口区域内的所有特征值进行分类,
图4。1-D中的基于面部评估。窗口的支撑区域跨越了m个特征位置。
图3和图4 中的方法应用了同样数量的特征计算,但是每个基于面部评估函数使用的特征量比基于窗口评估函数使用到的多,这些附加信息是层叠识别初级阶段中的一个优势,没有单一的哪个特征 可以因足够可靠而可以检测出所有目标并排除非目标中的一显著部分,通过应用多特征值,基于特征评估将会获得更佳的成绩。
基于特征方法只有在较复杂的积分函数中会带来额外的计算成本,c(.)。在一些合理的简化下该成本可以减少到最低,第一个简化方法就是做一积分函数并将其作为附加模式,该附加模式中的每个条件都依赖一单一的特征值:
注意到,h(•)的第二个参数详细指明了窗口中特征的位置,也就是说,即使在任何位置都使用同一特征函数来进行计算,它们的值将会随着窗口中每个位置上h(•)值的不同而不同 ,这些表示法保存了几何结构。
该附加模式设想将文数从m文减少到一文的m种模式 ,这样大大的减少了实际成本和计算所需。然而,附加模式的限制并不严格,类似Bayesian网络和Markov Random Filed的绘图概率模式可以表示为附加数,同样,由增压而产生的附加模式功能也很强大。
第二个简化方式表示特征,f(•)作为离散值,在该设想下,函数h(•)是由特征值和窗口中的位置值 来进行设定成的一个表,离散值的优势是仅仅需要实行表中的查找(内存访问)以及添加。
每个窗口的积分函数可以分别如下式计算:
在这个公式中,积分函数令nm的值随机产生(不一定要连续),
Nm越过n个窗口,其中每个窗口所支持的区域内含有m个特征,然而,我们可以重新组织这些计算结果以致大部分记忆存取顺序化。实际上,f[k]的每个值有助于m个窗口的分类。我们就此可以存储到连续的记忆空间中的m个值,h(f[k],•)。每个值都可以顺序地添加到合适的m个窗口中的分类值上。在我们的执行中对这些值的顺序访存可以将计算时间至少减少至原来的60%。
基于特征的评估在层叠法的初期是最有用的,该阶段的目标是尽可能快的移动更多的窗口。然而,一旦这个目标达到了 ,基于特征评估法的几个限制将会使其在后期阶段中不适用。尤其,它在窗口中的所有位置计算同一特征函数f(•),尽管它可能有利于在不同位置计算不同的特征值,例如,在一张脸面上,它可能有利于对眼睛周围的器官以及鼻子周围的突出器官的计算,同样,亮度修正的计算也和局部区域的特征值有关,正如我们下节要讲述的。
基于窗口的评估法提供了一个比第一个方程式更全面的式子,它更适合层叠法的后期阶段,
在此,不同的特征可以在窗口中不同的位置上进行计算 ,例如,每个ff(•)可能在分类窗口中有一个不同的支持区域:
实际上,我们的检测通常使用多窗口居中阶段的下一个单一的基于特征阶段,该排序方式在对多个目标的识别中就速度和精确度而言都得到了很好的效果,尤其,基于特征阶段通常从考虑项中移除了99%以上的非目标窗口。
3.层叠阶段的成分
这段讲述了一层叠阶段的构成,它包括子分类结构,特征表示,亮度修正的方法,以及估计字分类模式的方法。
3.1 子分类结构
每个子分类阶段描述为贝叶斯分类[11]。一个贝叶斯分类将输入分解成一个个子集,该分类在每个子集中是依赖统计的,而子集视为非统计的,下面我们将贝叶斯分类表示为log型的式子:
其中 是在分类窗口中的输入变量, 是这些变量的子集,其中 和 指明了两个类,对于目标检测的问题,这两个类分别是目标类和非目标类 ,例如 , 可能与脸面相符合,而 则相对应于非脸面。在该式子中,如果
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>
C++人脸识别系统(论文+算法+英文文献翻译+源代码) 第3页下载如图片无法显示或论文不完整,请联系qq752018766