两边同时取傅里叶变换得到:
又考虑st和 nt相互独立,所以可以得到:
Pyy wPS wPn w
将公式(9)和(10)带入(8)中,则有:
在上面的计算过程中, Pn w代表了对噪声的估计, Ps w则是原始的语音 信号功率谱,每一帧估计的干净的语音信号频域为:
Y w是 yt的幅度谱。因为人耳对于语音信号的分量幅度却无法感知,所 有 Sˆw 的相位谱可用 yt的近似代替,最后通过傅里叶变换得到去噪后的语音 信号时域的表达式。
维纳滤波器的优点是在很多情况下都使用,不管是在平稳随机过程,还是 离散的,又或者是标量的还是向量的,都是比较适用的。利用维纳滤波器后, 对增强后的语音信号进行分析的话,我们会发现处理过后的语音信号并不会像
其他算法增强后一样存在着音乐噪声,只会残余一些类似于白噪声的信号。人 耳对于语音信号的幅度是能够感知的,但对于语音信号的分量幅度却无法感知, 正因为这个特点,所有可以使用维纳滤波其来进行语音增强存在着一定程度上 的缺陷。
3。2 子空间算法
子空间语音增强算法是一种针对时域分析的算法,通过对带有噪声得语音 信号分成语音子空间和噪声子空间,这个算法再利用原始采集到的语音信号投 射到语音信号子空间上,得到的这个投影就是该语音信号的估计值。
在众多的研究过程表明,语音矢量的协方差存在众多的零特征值,这就表 明了,纯净的语音信号矢量的能量大多都分布在其所对应的空间的一个子集中。 噪声信号的矢量却存在于整个带噪声的语音信号空间中。所以可以知道这个空 间可以通过纯净的语音信号加带噪声的语音信号的子空间,再加上一个由纯噪 声的信号子空间构成,这样就可以用信号子空间处理技术,将纯噪声的信号子 空间消除掉,同时对纯净的语音信号进行估计。
y 就是代表原始的语音信号, s 代表的就是纯净的语音信号,n 表示原始语 音中噪声信号部分,则能有
其中可以知道可以用式子 sˆ Hy 来对纯净的语音信号进行估计,sˆ 是 s 的线 性估计,H 为 K*K 维的线性估计矩阵,可以得到纯净的语音信号的最佳线性估 计矩阵
拉格朗日乘子 , Rs 表示纯净的语音信号的协方差矩阵, Rn 表示噪声信号 的协方差矩阵,我们可以再利用特征值分解,得出白噪声下的最佳估计矩阵为
其中的 U 表示 Rs 的特征向量矩阵, s 代表了其特征值对阵矩阵。 在有色噪声的情况下,我们假如只考虑到 Rs 的对角化,
1U T 这就不是最佳估计,最佳估计必须考虑到对角化 矩
阵 Rs 和 Rn ,因为由矩阵理论我们知道这两个矩阵是 Hermitian 矩阵,所有 Rs 和 Rn 的联合对角化和矩阵束( Rs , Rn )的广义特征值分解等价。所以语音增强最后 就是求 Rn Rs 的主特征向量矩阵。
心的噪声,使得语音信号的质量和可懂度得到了极大的改善,然后缺点也是十 分的明显,因为要计算协方差矩阵,计算量大且复杂,不能够实时解决语音强 化处理,所有现在并不是主流的语音强化算法。相信经过计算机性能不断地提 高,子空间算法还有很大的提升空间。
3。3 噪声对消法
噪声对消法是一种最基本的减谱算法,它的基本工作原理就是将带噪声的 语音信号中把噪声给直接去除。由于带噪声的语音信号是由噪声和语音信号组 合起来的,所以这种方法的关键就是准备复制噪声。如果我们使用双声道采集 系统可以很好地解决这个问题。