摘要
驾驶舱话音记录器(CVR)在飞机黑匣子中记录了许多驾驶舱声音,如扬声器的声音,噪音和环境背景声音,这个工具具有特殊的意义。一般情况下使用传统的分辨和听觉方法,驾驶舱声音的复杂性加剧了分析难度,很难从非平稳的声音内捕获新的驾驶舱声音。本文首先分析驾驶舱声音的特征,我们开发了升级的迭代频谱减法和双重阈值,作为语音活动检测方案,为了演示所提出的方案的有效性,我们用一段语音(SNR = 8)和一段真正的驾驶舱声音进行模拟,并比较三种算法的概率Pcs和Pcn,其中Pcs表示正确检测语音帧的概率,Pcn表示正确检测噪声帧的概率。本研究提出了仿真结果,以证明改进算法的有效性。论文网
1。 引言
驾驶舱话音记录器(CVR)在飞机黑匣子中记录了许多驾驶舱声音,如扬声器的声音,噪音和环境背景声音,这个工具具有特殊意义。它们是具有突变特征,瞬时性和奇异性的复杂非平稳信号。在一些特殊情况下,在背景声音中夹杂这演讲者声音,这些信息在空中事故调查(AAI)中起着重要的作用。但是,当飞机飞行时,特别是发生事故时,CVR的记录状况变得并不理想。因此,从驾驶舱声音中快速提取扬声器声音是AAI中的重要工作。常规的AAI测量是基于“差分和听觉”方法和简单的音频处理,因此不容易获得更精确的扬声器声音。语音活动检测(VAD)只是检测到一段语音信号的开始和结束,达到了将扬声器语音与背景音区分开的目的。 AAI中的VAD需要适当的检测和较低的计算成本,目的是为AAI获得更多的时间。基于短时能量和零交叉率的传统双阈值VAD,在高信噪比(SNR)的情况下获得了理想的性能结果,但是当扬声器的声音淹没在强背景声音内或在低SNR时,效果不理想,例如,当事故发生时。
语音活动检测(VAD)只是检测到一段语音信号的开始和结束,达到了将扬声器语音与背景音区分开的目的。 AAI中的VAD需要适当的检测和较低的计算成本,目的是为AAI获得更多的时间。基于短时能量和零交叉率的传统双阈值VAD,在高信噪比(SNR)的情况下获得了出色的性能结果,但是当扬声器的声音淹没在强背景声音内或低SNR时,具有完全失效,例如,当事故发生时。
在本文中,我们研发出具有谱减法的双阈值VAD的改进方案。论文结构如下:第2节分析驾驶舱声音的特点。第3节和第4节分别介绍了基于双阈值和基本谱减法的传统VAD方案。第5节和第6节提出了改进方案,本节还给出了仿真结果。最后,第7节得出了一些结论。来-自~优+尔=论.文,网www.youerw.com +QQ752018766-
2。 CVR的语音特征
CVR记录座舱声音的频率范围非常广泛,约150Hz至6800Hz,这对声音分离带来一些困难。 为了提供声音分离的效率,驾驶舱声音分为三种:航空噪声,扬声器声音和环境背景声音[1][2]。
航空噪声包括附加噪声和非附加噪声。 附加噪声包含周期性噪声,脉冲,宽带噪声和语音干扰。 非附加噪声主要是声音残留和电路噪声。 通过特定的变换可以将非附加噪声转化为附加噪声。 然而,航空噪声包括发动机声音,飞行时的外部气流噪声,起飞和着陆时的滑行噪声,电气设备和电路中的电路噪声,操纵飞行器时电力驱动的电机噪声等。