尽管语音检测面临着很多困难,然而由于基因周期在语音信号处理领域的重要性,使得语音基因周期检测一直是不断研究改进的重要课题之一。数十年来,国内外众多学者对如何准确地从语音波形中提取出基因周期作了不懈的努力,提出了多种有效的基音周期检测方法。我国基因检测方面的研究起步要比国外发达国家晚一点,但是进步很大,特别是对汉语的基音检测取得成果尤为突出[6]。目前的基因检测算法大致可分为两大类:非基于事件检测方法和基于事件检测方法(这里的事件是指声门闭合) [2]。59665
非基于事件的检测方法主要有:自相关函数法、平均幅度差函数法,倒谱法,以及在以上算法基础上的一些改进算法[1]。语音信号是一种典型的时变、非平稳信号,但是,由于语音的形成过程是和发音器官的运动密切相关的,而这种物理运动比起声音振动速度来讲要缓慢得多,因此语音信号常常可假定为短时平稳的,即在短时间内,其频谱特性和某些物理特征参量可近似地看作是不变的。非基于事件的检测方法正是利用语音信号短时平稳性这一特点,先将语音信号分为长度一定的语音帧论文网,然而对每一帧语音求基音周期。相比基于事件的基音周期检测方法来说,它的优点是算法简单,运算量小,然而从本质上说这些方法无法检测帧内基音周期的非平稳变化,检测精度不高。对于需要检测出一帧内每一个基音峰值点的语音合成系统来说,无法得到很好的效果[6]。
基于事件的检测方法是通过定位声门闭合时刻来对基因周期进行估计,而不需要对语音信号进行短时平稳假设,主要有小波变换方法和Hilbert-Huang变换方法两种。在时域和频域上这两种方法又具有良好的局部特性,能够跟踪基因周期的变化,并可以将微小的基因周期变化检测出来,因此检测精度较高,但是计算量较大。
基音周期检测提取的国内外研究现状:http://www.youerw.com/yanjiu/lunwen_64950.html