估计相对时间差常用的方法是由Knapp和Carter在1976年提出的广义互相关法(GCC)。由于实际情况中常常存在混响和噪声,所以伪峰干扰非常有可能出现来影响结果。为了尽可能消除伪峰干扰,通常采用广义互相关法,就是以一个加权函数乘在接收信号的互功率谱上从而抑制伪峰。这对于信号起到了锐化作用,也降低了室内混响、噪声的干扰。这种算法可以说是一种早期的较简单的算法,它的优缺点非常明显。
该方法的优点在于运算量小,能够满足实时定位的要求。但是,这个算法也是不尽如人意的。首先,尽管它的小运算量使其具备了实时性的优点,但是由于其定位原理,这种定位的实时性并不能看做绝对意义上的实时,因为它在对于时间延迟的估计和方位的估计并不是同时的。另外,这种方法在存在较强反射和噪声的情况下也无法精确估计延时,也就是说这种算法只能在非常理想的环境下使用,所以实用性较低。最后,此方法仅可以应用在单声源上,这也是它的非常大的一个局限。
2。2 高分辨率谱估计定位法
这种方法是首先需要信号的空间谱,进而得到相应的相关矩阵,再最终定位目标的方向的方法。它的原理与另外两种方法的差别比较大,所以特点也有一定的差别。
首先,实际情况下,基于高分辨率谱估计的定位技术的稳定性和效果不高,不如可控波束性法。这是因为要计算得到估计谱时,必须要对一定时间内的全部信号取均值,并且信噪比、声源位置等参数必须不变。这一条件太过苛刻,实际应用中较难达到,所以无法被用在大规模的生活场景或者复杂的军事作战环境中,这基本上就宣判了它不会在声源定位领域被重视。
另外,这种定位方法通常情况下是应用在窄带信号上的,但是我们知道语音信号是宽带信号,所以难以使用。因此这种定位方法的定位效果常常无法满足人们的实际需求,因此也很难得到大规模的发展与应用。来;自]优Y尔E论L文W网www.youerw.com +QQ752018766-
2。3 基于最大输出功率的可控波束形成定位法
这种方法的原理是将空间中的声源点与麦克风的输出功率对应,对麦克风信号加权求和后再进一步变换麦克风阵列的方位进行空间扫描,当扫描空间时得到一点使麦克风信号输出功率最大,则该点对应为声源点。常用的两种形成器为时延求和波束形成器和滤波求和波束形成器。
这种方法是较早出现的一种声源定位方法,于1973年由Hahn和Tretter提出。常用于雷达、检测信号等等。这种方法对定位场景的先验条件有一定的要求,但真实情况下难以满足这些。而且,这种方法在实际应用中常常会出现较大的误差,这是因为最开始选点时如果准确率不够就会导致的在结果函数中出现的多极点情况,进而致使定位系统把错误的极值点当做声源点来对待。此外,如果采用相应的高精度算法来避免这种情况则非常有可能影响实时性,这也是这种方法的局限所在。2000 年,美国DiBiase博士提出了一种新的联合可控响应功率和相位变换(SRP-PHAT)的声源定位方法,此方法将所有麦克风对的GCC-PHAT函数求和得到SRP-PHAT函数,再在空间中搜索使SRP-PHAT值最大的点进而定位声源。它不同于以往采用TODA的方法,而是采用了结合麦克风接收信号的方法,使得声源定位系统具有抗混响性、鲁棒性,大大提高了在实际环境中定位的准确性。如今,SRP-PHAT 算法以其独特的优势已经逐渐得到人们的重视。
3 基于相位变换加权的可控响应功率法
3。1 声源模型