点击“载入语音”按键,会跳出一个对话框,可在计算机中任意选择识别对象。
选择一个WAV音频对象(如‘测试模板数字1’)之后,点击“文件识别”按键,则会识别结果,识别结果显示如图13所示。
图13 识别结果显示
对正确语音数字1的语音识别结果,即当参考模板中有待识别语音时会在命令窗口显示运行结果“i=1”, 正确识别在命令窗口显示的识别如图14所示。
图14 正确识别在命令窗口显示的识别
以上识别步骤可重复运行,通过对十个数字各测试10次,识别正确率可达百分之百。
对于非孤立词数字语音将不能识别,即除0~9的孤立词语音的识别都会在命令窗口报错,用户界面也将无识别结果。
4. 总结
本设计阐述了多种语音识别技术的应用,结合自己的知识水平,最终选择了对于孤立词语音的识别。
本设计的优点在于,选择了利于识别孤立词语音的DTW识别算法,DTW算法的优点就在于能有效提取人类孤立词语音高频特征,以提高准确率。以及运用了MATLAB中的GUI交互方式,可以反复使用且操作简便。
本设计的缺点有,采用的DTW算法不能有效识别连续语音,现只局限的适用于识别常出现孤立词语音的小型化、便携式语音产品。并且随着模糊数学等新型理论的发展,本设计的算法没能结合数学理论作进一步研究。 MATLAB语音识别系统的设计+DTW算法+流程图(9):http://www.youerw.com/tongxin/lunwen_809.html