麦克风阵列已广泛应用于各种音频视频会议、语音识别及增强等领域。具体而言,声源DOA估计在监视,跟踪,电话会议和助听器都具有广泛的应用。在军事方面声源测向技术也被广泛地应用在飞机,火炮、狙击手探测等方面。声源定位技术是基于麦克风阵列的阵列信号处理的关键技术之一,是语音信号处理领域的一个新的研究热点。虽然声源DOA估计是一个成熟的领域,但是挑战未解决的问题仍旧是后续研究的课题。其中之一的矛盾就是当源的数量超过麦克风时确定DOA。33695
最近,一种基于独立分量分析的DOA估计方法(ICA)已经被提出[14-15]。它直接从分离矩阵估计DOA估计ICA通过利用分离矩阵与源混合过程相关的事实。由于这种方法是基于ICA,它只允许M>N的情况,然而,它仍然不能应用当M<N。论文网
当麦克风少于源的时候,尤其是在有噪声和混响的情况下,确定语音信号的DOA很困难。语音信号在时频域上已知具有不平稳性和稀疏性。大量研究已利用这两个属性来解决语音信号的DOA估计。大多数的研究通过假定“一个单频点仅由一个源占用”进一步简化问题。通过使用这一假设,文献中基于一个峰值对应相对振幅和延迟参数的二文直方图在每个时频点进行估计DOA[1]。在同样的假设下,我们可以从聚类质心聚类归一化时频点并估计DOA[2]。也可以通过从相同源的时频点得出平均协方差矩阵来假设调频源和DOA[3]。为了解决源的先验知识问题,另一篇文献用相关性测试来选择只包含一个主要来源的一阶时频点[4]。对源没有先验知识的情况下,其中提出的和起始点检测类似的噪声基底跟踪和相关性测试有力地说明了只有一个来源的时频点占主导地位。
DOA的另一个问题估计是混响。虽然人类能够在很严重的混响环境中分辨声源,但是目前的DOA估计技术只能处理适量的混响。文献表明,人类有这样的能力由于优先效应:当波达的声音和随后的声音之间的滞后明显地短(<40毫秒),所有的声音融合成一个单一的声音导致波达感知的方向完全由先到的声音(起始点)决定的[5]。我们可以用3个麦克风应用优先效应检测起始点来估计两个源的DOA[6]。另一个需要注意的问题是噪声的存在。由于语音信号在时频域上的稀疏性,有些时频点只包含噪声,因此,使用噪底跟踪消除这些时频点有利于提高DOA估计准确性。
- 上一篇:遗传算法的国内外研究现状概述
- 下一篇:无线通信技术国内外研究现状
-
-
-
-
-
-
-
浅析中国古代宗法制度
NFC协议物理层的软件实现+文献综述
高警觉工作人群的元情绪...
C++最短路径算法研究和程序设计
现代简约美式风格在室内家装中的运用
上市公司股权结构对经营绩效的影响研究
g-C3N4光催化剂的制备和光催化性能研究
江苏省某高中学生体质现状的调查研究
巴金《激流三部曲》高觉新的悲剧命运
中国传统元素在游戏角色...