2。3。2 滤波
滤波,这是一个选择让一定频率段的语音信号通过而其他的频率段的信号遭到减弱的的过程,达到将我们要识别的语音信号与其他信号隔离开的目的,这样使得我们更加便捷的识别语音信号。
2。3。3 特征提取
特征参数选取通常使用两种方法,一种是LPCC(线性预测倒谱参数)和MFCC(频率倒谱参数)由于篮球场环境较为复杂,所以本次实验采用MFCC参数。识别语音中,我们只需要提取语音信号的MFCC参数即可,其计算流程如下:
(1)预加重滤波是利用传递函数滤波器 对语音信号进行滤波操作;
(2)倒谱提升窗口,为K阶MFCC的参数K乘以不同的权系数公式:
(3)差分倒谱参数可以用 求的。(k为常数,c和d为一帧语音信号参数。按此公式算n次得到n阶差分参数而我们只需要一阶)
(4)将语音信号的MFCC与一阶差分方程合并为一个特征向量就是我们所需要的最终特征。
2。4 识别模块
本次仿真的训练算法是VQ算法(矢量量化)
2。5 数据库的建立
数据库是为了后续的识别工作提供一个能够查询建立一个关于语音和特征参数的库。
我们要建立的数据库包括两个部分,一个是语音表,另一个是特征参数表。语音表是关于参考语音模式的表,特征参数表是关于参考语音参数的表。
语音表表格如表2-5A
字段名 数据类型 长度 是否为主键 描述
Speech_id int 4 是 语音编号
speechname var 15 否 语音名称
表2-5A语音表来自优O尔P论R文T网WWw.YoueRw.com 加QQ7520`18766
本次仿真将使用8阶MFCC参数和其一阶差分参数合并后作为特征参数参数,表格如表2-5B
字段名 数据类型 长度 是否为主键 描述
Param_id int 4 是 参数编号
1component float 8 否 第1分量
2 component float 8 否 第2分量
3 component float 8 否 第3分量
4 component float 8 否 第4分量
5 component float 8 否 第5分量
6 component float 8 否 第6分量
7 component float