语音信号是一个随着时间变化的非平稳随机过程,具有时变性。但在一个较短的时 间范围内(10~30ms)可认为其特性保持不变,即具有短时平稳性。语音信号的处理都 基于短时平稳性。
2。1。1 语音信号预处理来,自,优.尔:论;文*网www.youerw.com +QQ752018766-
1)预加重
我们观察语音信号的频谱时可发现,在频率越高的地方语音信号成分越小。为此需 要先对语音信号进行预加重,提升高频部分,滤除低频干扰。预加重通过一个一阶的数 字滤波器来实现:
其中为加重系数,取值一般接近于 1。 2)分帧与加窗
由于语音信号的时变性和短时平稳性,在实际处理语音信号时需要将其分成多个短 时间的语音段,即分帧。因为语音信号在 10~30ms 内可认为相对平稳,帧长一般取 10~30ms。分帧包括连续分帧和交叠分帧,我们多采用交叠分帧,使帧与帧之间能够平 滑过渡。帧移是指前后两帧之间的交叠部分,通常取 0~1/2 帧长。为了减小语音信号截 断产生的频谱能量泄漏,我们通过加窗来实现分帧。多种窗函数都可以用来截断信号, 常用的窗函数有矩形窗、汉明窗、汉宁窗。