(4.7)
其中k = (-N + 1)一(N -1)。由于信号的自相关函数在基音周期的整数倍位置上会出现峰值,因此可通过检测峰值的位置来提取基音周期,再取倒数就得到了最终的基音。当对音乐信号的每一帧信号提取基音后,可形成基音串,而基音串值的变化可对应音调的变化。在此基础上可提取音乐的内容特征如旋律变化和音调变化等,并进行检索。但是自相关函数的峰值提取会受到音乐信号的共振特性影响。有的情况下即使窗长已选得足够长,第一最大峰值点与基音周期仍不一样,这是因为共振腔的共振峰特征造成了干扰。当基音的周期性和共振峰的周期性混叠在一起时,被检测出来的峰值就会偏离原来峰值的真实位置。有两种方法可以解决这个问题,一是用一个带宽为60一900Hz的带通滤波器对音乐信号进行滤波,再对滤波后信号的自相关函数进行基音估计;二是对音乐信号进行非线性变换后再求自相关函数。在进行实验和系统实现时,我采用了非线性变化方法中的中心削波法。设中心削波器输入信号为x(n),中心削波的输出信号为y(n),则中心削波函数为:
其中Cl为削波电平,大小由信号的峰值幅度来确定,一般为一帧信号中最大幅度值的一个固定百分比。音乐信号的低幅度部分包含了大量的共振峰信息,而高幅度部分包含了大量的基音信息。经过中心削波后只保留了超过削波电平的部分,而削去了许多和共振腔响应有关的波动。对中心削波后的音乐信号,求其自相关函数中峰值周期所对应的基音周期,准确率得到大大提高。
(3)简化逆滤波法
简化逆滤波法是自相关处理法进行基音提取的一种现代化版本。这种方法是先计算语音合成模型参数,利用这些参数对原信号进行逆滤波(详见附录A),消除声道的共振影响,再用自相关法求得基音周期。最后通过与门限的比较确定有声段和无声段,并去除无声段中的干扰数据。
首先,语音信号经过8kHz取样后,通过0—900Hz的数字低通滤波器,目的是滤除噪声的影响,使峰值检测更加容易。考虑到声带所产生的激励序列的最高频率小于1kHz所以采样率用2kHz就足够了,因此我们在实际中降低采样率4倍。当然,后面要进行插值。其次,提取降低取样率后的信号模型参数(线性预测系数),并对声音信号进行逆滤波。之后对逆滤波后得到的原始信号求自相关函数的峰值就得到基音的周期值。最后进行有无声判决,去除无声段中由噪声产生的特征数据,提高准确性。
自相关法计算基音周期的速度很快,但自相关函数的峰值提取会受到音乐信号的共振特性影响。我们采用60一900Hz的带通滤波器对音乐信号进行滤波,再对滤波后信号的自相关函数进行基音估计,实验发现效果并不理想。若采用中心削波法来处理,实验发现削波电平的值很难确定,如果削波电平设置的大了,会破坏原信号的基音周期;如果削波电平设置的小了,又起不了作用。而实际上,音乐信号的幅度变化比较大,即使采用一些自适应的办法来根据音乐信号的幅度调整削波电平,效果也不是很好。
倒谱法计算基音周期比较准确,但是太复杂,对每帧信号要计算DFT,取对数之后再计算IDFT,计算量太大,速度不快。对于一个检索系统,不仅要求准确,而且要求实时性好。所以在精度和速度之间的权衡下,系统采用了简化逆滤波法。
- 上一篇:MATLAB铁路监控视频的超分辨率技术研究
- 下一篇:仿生模式识别方法及应用的研究+文献综述
-
-
-
-
-
-
-
中国传统元素在游戏角色...
高警觉工作人群的元情绪...
浅析中国古代宗法制度
C++最短路径算法研究和程序设计
现代简约美式风格在室内家装中的运用
NFC协议物理层的软件实现+文献综述
上市公司股权结构对经营绩效的影响研究
g-C3N4光催化剂的制备和光催化性能研究
江苏省某高中学生体质现状的调查研究
巴金《激流三部曲》高觉新的悲剧命运