另外对于人耳的听觉感知特性的了解也是十分必要的,人耳对于语音信号 的幅度是能够感知的,但对于语音信号的分量幅度却无法感知。同时掩蔽效应 是人耳的一个特点,强信号会将同一时间内的弱信号掩蔽掉,短时谱中的第二 共振峰比第一共振峰更为重要。
2。2 噪声的特性
噪声能在许多地方中产生,同时噪声也能分成两类,一类是加性的,另一 类就是非加性的。因为加性噪声具有普遍性,所以在一定的条件下。我们可以 把加性噪声可以这几种,分别是脉冲噪声,周期噪声,宽带噪声,同声道其他 语音噪声。
脉冲噪声:它主要体现于时域波形中的突然出现的脉冲,可以是放电造成 的。脉冲噪声能够在时域中去除掉,我们可以利用阈值,阈值就是根据带有噪
声的语音信号幅度的平均值得出的,如果一个信号过了这个值,则它就是脉冲 噪声,对其进行衰减或者彻底消除。
周期噪声:其特点是含有许多的离散的窄谱峰,它来自于发动机这类的周 期性运行的设备,语音系统中的电气也能干扰产生。
宽带噪声:它的来源有许多,比如呼吸,气流等引起的噪声都可以称它为 宽带噪声,这种噪声信号和语音信号基本是合在一起的,因此我们要对其进行 处理分析才能解决这个难题。同声道其他语音干扰:干扰语音是在另一个信道 传输造成的。
3 语音增强算法
3。1 维纳滤波法
维纳滤波器是用最小均方误差准则来设计的一种数字滤波器,先是采集原 始语音信号,输出想要的语音信号的估计值。同时,在处理信号的过程中,维 纳滤波器对这个信号有着苛刻的要求,信号一定要有足够的平稳性,因为维纳 滤波器要在稳定的条件下才能最优地评估最小均方误差。通常情况下,语音信 号并不会满足其平稳性,实际情况下也不会是稳定的。维纳滤波法是通过对噪 声和带有噪声的语音信号评估的功率谱来构建维纳滤波器的传递函数,然后从 其功率谱中算出干净的语音信号的功率谱,再利用原语音频谱的相位,用傅里 叶反变换来恢复增强过后的语音信号。
维纳滤波的基本方法是设一个线性系统,其单位样本响应是 hn,当输入 一个采集到的随机信号 xn,该信号包括噪声信号 wn和语音信号sn,得到
则输出
我们希望的是 x(n)与语音信号 s(n)尽可能的接近,我们可以用 s(n) 来
表示 hn的估计值即
则可以知道维纳滤波器的输入—输出关系用下面表示。
图 3-1 维纳滤波器输入-输出关系
实际中,公式(2)所展示的形式可以理解为观测值 x(n) ,x(n 1) ,x(n 2) …
^
x(n m) ,…来估计信号的当前值 s(n) 。因此,我们用的方法是一种统计问题来
进行过滤。论文网
维纳滤波器又能叫做最佳线性过滤与预测或线性最优估计。最佳和最优遵 循的准则就是最小方均误差。
^
假如我们分别以 s(n) 与 s(n) 表示信号的真实值与估计值,而用 e(n) 表示他
们之间的误差,即
^
e(n) s(n) s(n)
(3-4)
显然 e(n) 可能是正值,也可能是负值,是一个随机变量。所以我们可以利 用均方误差来表达:
我们利用的这个表达式的原因在于理论简单,不需要描述概率。 首先我们先对带有噪声的语音信号进行加窗分帧处理,语音信号具有短而
稳定性,所以我们可以用维纳-霍夫积分方程