元音具有基音与共振峰结构,辅音则不具有这两者。元音音色由共振峰的频率值和相对关系决定。元音的共振峰特征用于语音合成。
1.2 目前各种研究方法及优缺点
1.2.1 语音的频率域特征分析
语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。
1.2.2 语音的频率域特征参数
(1)语音的频谱
语音的频谱具有非常明显的语言声学意义,能反映一些重要的语音特征。实验表明,人类感知语音的过程和语音的频谱特性关系密切,人的听觉对语音的频谱更敏感。因此,对语音信号进行频谱分析是认识和处理语音信号的重要方法之一。语音频谱是语音信号在频域中信号的能量与频率的分布关系。
倒频谱:在求取语音倒频谱特征参数的过程,它可以通过同态处理来实现。同态处理实现了将卷积关系变换为求和关系的分离处理,即解卷。对语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道的共振峰特征和基音周期,用于语音编码、合成、识别等。对语音信号进行解卷,求取倒谱特征参数的方法有两种:线性预测分析和同态分析处理。
功率谱:反映了单位频带内信号能量随频率的分布、变化情况,它在语音分析研究中发挥了重要的作用。
(2)临界特征矢量
临界带特征矢量从人耳对频率高低的非线性心理感觉角度反映了语音短时幅度谱的特征。它的畸变可以用欧氏距离来度量,所需的变换可以用高效的FFT来完成,因而使用此特征矢量时计算开销较小。所以可以用临界特征矢量来作为语音识别系统特征矢量。
1.2.3 语音特征参数提取方法
(1)带通滤波器组法:语音信号 输入带通滤波器 ,滤波器输出为具有一定频带的中心频率为 的信号。宽带带通滤波器具有平坦特性,它可以粗略地求取语音的频谱,其频率分辨率降低,相当于短时处理时窗宽较窄的情况;使用窄带带通滤波器,其频率分辨率提高,相当于短时处理时窗宽较宽的情况。
(2)傅里叶变换法:是通过对 (通过傅里叶变换后的信号)的研究来了解原始信号 中所含有的各种频率成分。优点:这种变换实际是两个空间的转换,一个是原始信号的时间空间,另一个是变换信号的频率空间。我们可以分别研究这两个空间中信号的不同表现形式,来对信号的时间和频率两个方面分别予以研究。缺点:无法对信号在某一时间点,或者某一时间段的频率成分进行分析。论文网
(3)短时傅里叶变换法:基本思想是假定非平稳信号 的分析窗口 在一个短时时间间隔是平稳的,如果移动分析窗函数,使得 在不同的有限时间段内也平稳,从而可以计算出非平稳信号在各个不同时刻的功率谱。优点:可以计算出非平稳信号在各个不同时刻的功率谱。缺点:不能根据信号高、低频率的变化,自适应地调整分析窗口的宽度,因此它在时域局部化的精细方面和灵活方面表现较差。
(4)小波变换法:采用了面积固定不变但形状不断改变的分析窗口来对非平稳信号进行变换。因此小波变换具有多分辨率分析的特点,其在时、频两域都具有表征信号局部特征的能力,是一种时间窗和频率窗都可以改变的时、频局部化分析方法。小波变换在低频部分具有具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于分析非平稳信号。又因为语音信号是一种典型的非平稳信号,因此小波变换在语音信号处理应用很广泛。