1 引言
1.1 背景
由于语言是人们在日常生活中的主要交流手段,因此语音信号处理在现代信息社会中占用重要地位。随着语音信号处理技术在实际生活中的应用的不断发展,语音信号处理技术已经被广泛地接受和使用。由于语音比其他形式的交互方具有更多的优势,因此这项技术已经越来越贴近人们的生活。目前,语音信号处理技术处于蓬勃发展时期,不断有新的产品被研制开发,市场需求逐渐增加,具有良好的应用前景。
1.2 语音特性的提取
语音信号处理虽然包括语音通信,语音合成和语音识别等方面的内容,但其前提和基础是对语言信号进行分析。语音的压缩与恢复是语音信号处理的关键技术。近年来有关这方面的研究不断发展成熟,并形成一系列的标准。在语音信号的各种分析合成系统中,需要提取频谱包络参数,推测音源参数(清浊音的判定以及浊音周期等)。只有将语音信号分析表示成其本质特性的参数,才有可能利用这些参数进行高效的语音通信,才能建立用于语音合成的语音库,也才能建立用于识别的模板或知识库。
汉语是一种声调语言,其声调和音素一样具有区分语义的作用。而声调识别又必须以语音基音周期估计为基础。因此基音周期是汉语语音信号处理及应用中需要的最基本的特征参数之一。自上个世纪70年代至今,已经发展出多种基音频率提取方法,目前普遍采用的是自相关函数法、倒谱解卷积法和小波算法。根据所分析的参数不同,语音信号分析可分为时域,频域,倒谱域等方法。
由于语音信号并不是严格的周期信号,因此自相关法只能得到基音的估计值。而倒谱解卷积法受加性噪声影响比较大,抗噪声性能不是很好。小波算法受大尺度平滑作用和噪声的影响,基音定位容易产生偏差和漏报。
针对倒谱解卷积法所存在的问题。本文中提出了一种基于倒谱和EMD的语音基音周期提取的算法。该算法对经过倒谱解卷积后的语音信号进行EMD变换,有效地的将周期性脉冲、声道冲击响应分量和噪声有效的区分开,来获得基频的准确位置,从而减小冲击响应分量和噪声而产生的位置偏差,并且提高抗噪声性能。
2 基于倒谱的基音周期的提取
2.1 基音的相关知识
2.1.1 基音周期
人在发浊音时,气流通过声门使声带产生张驰振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量。这种声带振动的频率称为基频,相应的周期就称为基音周期。基音周期是语音信号最重要的参数之一,提取该参数是语音信号处理中一个十分重要的问题。对于汉语这种有调语音,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能。根据加窗的短时语音帧来估计基音周期,在语音编解码器,语音识别,说话人确认和辨认,对生理缺陷人的辅助系统等许多领域都是重要的一环。
2.1.2 基音检测的难点
自进行语音信号分析研究以来,基音检测一直是一个重点研究的课题,很多方法已被提出,然而这些方法都有它们的局限性。迄今为止,尚未找到一个完善的可以适用于不同的说话人,不同的要求和环境的基音检测方法。
基音提取的难点主要体现在:
(1)语音信号变化十分复杂,声门激励的波形并不是一个完全的周期序列。在语音的头尾部并不具有声带振动那样的周期性,对有些清浊音的过渡帧很难判定它属于周期性还是非周期性,从而对估计基音周期带来一定的影响。 Matlab基于倒谱和EMD的语音基音周期的提取(2):http://www.youerw.com/tongxin/lunwen_7088.html