语音信号的频谱及共振峰特征分析(4)
时间:2021-12-12 21:55 来源:毕业论文 作者:毕业论文 点击:次
发清音时,清音激励可以看成随机白噪声,均值为0、方差为1,因为发清音时,声道被阻碍形成湍流。 2。2。2 声道模型 目前最常用的声道模型有两种。一种是“声管模型”,把声道看作由多个等长度的但是横截面积不同的管子串联而成的系统;另一种是“共振峰模型”,把声道看作为一个谐振腔,共振峰为这个谐振腔的谐振频率[2]。共振峰模型应用更为广泛,因此下面讨论的是共振峰模型。 共振峰模型又可以分为三种:级联型、并联型和混合型。 (1) 级联型 把声道看作为由一组二阶谐振器串联而成。声道具有多种谐振频率,可以将其模拟成一个没有极点的数学模型;其传输函数可以表示为如下: (2-3) 其中G为幅度因子,N为极点个数,ak 是常系数。此时可以将传输函数进行分解,可以得到公式如下: 式中M为小于(N+1)/2的整数,ai、bi、ci为常系数。 (2) 并联型 对于少数的元音和大部分的辅音,采用零极点模型。此时,模型的传输函数如下: 一般来说,N大于R,分子和分母间不能分解公因子并且分母无重根,因此可以将上式分解为部分分式之和,公式如下: (3) 混合型 级联模型简单可以描述大部分元音,不能描述鼻化元音、塞音和摩擦音等,并联模型比级联模型复杂,可以描述级联模型不能描述的。因此可以将级联模型和并联模型结合起来,这就是混合模型,混合模型综合了两种模型的优点,这是一种比较完整的共振峰模型。来*自~优|尔^论:文+网www.youerw.com +QQ752018766* 2。2。3 辐射模型 声道在口和唇部结束,在高频下,口唇辐射效应比较明显;在低频时,受口唇辐射影响比较小。因此,辐射模型R(z) 可以表示为一阶高通滤波器的形式。口唇辐射效应可以表示为: (2-7) 完整的语音信号数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示[2]。其传递公式如下: (2-8) 2。3 语音信号的特性 2。3。1 语音信号的时域特性 图2。3为一个女声说“一三”的时域波形,为使用普通麦克风录音的语音数据。采样频率为16kHz。该图的水平坐标为时间,纵向坐标为语音信号的幅度,从波形上可以看出不同的元音和辅音之间的波形是不同的,语音信号随时间变化。图2。4是语音“三”的辅音部分的/s/的细节图,可以看出,辅音的波形的幅度是非常低的,振动频率很高,接近于随机噪声。通过图2。5语音信号“三”的元音部分/an/的放大图,可以看到在很短的时间内的语音信号有周期特性。它的周期对应的频率就是基音频率。 (责任编辑:qin) |