2。2 语音信号的端点检测
端点检测是语音识别过程的一个重要过程,是进行语音识别的前提条件。端点检测是标记语言信号的开始位置和结束位置,将语音信号中无声段排除。端点检测能够减小语音识别的运算量。语音信号的端点检测如图2。2所示。
图2。2 语音信号的端点检测流程图
(1)归一化:一般情况下,为了处理方便,会将读取的语音信号归一化到[-1,1]。
(2)短时能量的作用: 可以比较容易地区分出语音信号中的浊音和静音。
(3)短时过零的作用:检测清音。由于清音的能量很小,采用短时能量检测会被判为静音,采用短时过零率可区分出静音和清音。
2。2。1 短时能量文献综述
语音段的能量是把噪声段能量和语音声波能量的加在一起的总和。将第n帧语音信号的短时能量En的定义为:
是序列的第n段短时语音,N表示帧长。由于计算的是信号的平方,所以用En度量语音幅度的变化有一个缺点:对高电平的变化十分的敏感。一般情况下,会采用下式代替:
这样就可以避免信号取平方而造成较大的差异。
2。2。2 过零率的计算
短时过零表示的是一帧语音信号的波形穿过横轴的次数。在本实验中,过零率表示的是样本符号发生变化的次数,定义语音信号的短时过零率Zn为: