频域分析就是分析语音信号的频域特征。本文中将运用傅里叶分析法来进行频域上的分析。在频域分析中,运用傅里叶分析法得出频域波形,从而分析出基因周期、共振峰频率及其位置等重要信息。
不过这两种语音分析方法都有各自的局限性:时域分析虽然表示语音信号比较直观,物理意义也比较明确,无法分析语音信号的频域特征,因此只能实现比较简单,运算量少的语音信号:同时频域分析没有解析语音信号在时域上的变化,因此在对语音信号分析时依赖于傅里叶分析。
所以,当实验将时域分析和频域相结合,研究时间-频率图形,又称为语音谱。其中谱的色彩浓淡代表了声音的强弱。它结合时域与频域分析的特点,展示了语音频谱随时间变化情况。
其中时域分析方法常用的方法有检测自相关函数、短时能量、短时过零率等方法。其优点是运算量较小,同时鲁棒性差的缺点也是显而易见的。所以,时域分析法需要根据个人经验或全局信息给定阈值。除此之外还有结合时域和频域分析方法的变换域方法,比如,MEL倒数系谱、相对熵函数、小波变换、共振峰分析等。[6]这几种方法有较高的正确检出率但是元算量过大,导致不能实时提取结果。
如今,有很多新的方法运用于语音的分割与识别。比如基于BP人工神经元网络的汉语语音声韵母分割方法、基于熵函数的耳语音声韵分割法、基于HHT瞬时能频值的含噪声语音声韵分割、基于时频分析的汉语孤立字词声韵分割法等等。
1.5 汉语声韵分割的历史背景
先前,国内许多专家对汉语的声韵分割方面已经有了很广泛的研究。
吕军, 马晓娜在《汉语孤立词声韵分割算法》一文中提出,由于不同类别的汉语语音段也不同,因此,可以通过此类方法来进行声母与韵母间的分割算法。[1]
薛瑞敏, 胡瑞敏在《基于BP人工神经元网络的汉语语音声韵母分割方法》一文中提出,通过BP人工神经元网络的声韵分割方法,不需要训练很多的音节,只需训练比较典型的少数音节,就可以实现汉语的声韵分割,同时,准确率也有保证。[2]
谈雪丹, 顾济华, 陶智,等在《基于HHT瞬时能频值的含噪声语音声韵分割》一文中提出,可以根据语音韵母的幅频特性,运用HHT的方法,分离出语音高频部分的瞬时幅值和瞬时频率。以这种方法去除低频的噪声,并且提炼出瞬时能频值来进行声韵分割。[3]
韩德亮在《基于时频分析的汉语孤立字词声韵分割研究》一文中提出,可以对时域短时能量与过零率进行分割,并进一步对信号进行经验模态分解和保号率的研究,实现对汉语孤立词的声韵时频上的分割方法。[4]文献综述
黄生, 何强, 张有为在《一种基于小波变换的声韵分割方法》一文中提出,可以利用一级离散小波变换的近似系数的乘积做为特征参数对汉语声韵分割做准确切分的有效方法。对比传统方法,这种方法有更好的切分能力。[5]
1.6 本文主要内容
由于语音信号本质上是非线性、短时平稳的,因此本文算法是以传统的短时能量&短时平均过零率方法为基础,对语音信号进行粗略的声韵分割点检测,然后利用EEMD的非线性分解滤波作用,再在此基础上确定精确的声韵分割点。
本文主要分为如下几个方面:在第一章中简要的介绍了语音识别的历史、现状及其原理与方法;然后简述了语音的发生特点,并简述了声韵分割的意义和现状;然后在第二章中介绍EMD和EEMD的原理、特性;在第三章中详细介绍了本文提出的基于EEMD声韵分割方法。通过语音实例来检测;最后,在第四章中通过在几个噪声环境下基于EEMD方法进行声韵分割,验证算法的准确性与可靠性,并与传统方法进行对比,进一步证明本算法的准确性。 EEMD复杂环境下汉语的声韵分割算法研究(5):http://www.youerw.com/tongxin/lunwen_78165.html