摘 要:本论文简单介绍了语音识别的发展及语音固定文本识别系统,并研究了在MATLAB环境下实现语音固定文本识别的具体方法。在语音固定文本识别系统中,首先对语音信号进行前期处理,再进行语音固定文本的Mel尺度倒谱系数(MFCC)特征参数的提取。通过比较动态时间规整算法(DTW)、隐马尔科夫模型(HMM)和矢量量化算法(VQ)这三种算法。最后,选取矢量量化算法(VQ)实现对少量语音固定文本的识别,该算法具有存储量和计算量都比较小的优点。94188
毕业论文关键词:Mel尺度倒谱系数 ,动态时间规整算法,隐马尔可夫算法,矢量量化算法
Abstract: This paper briefly introduces the development of speech recognition and speech recognition system, and studies the method of speech recognition in MATLAB environment。 In the speech recognition system, firstly, the speech signal is processed in advance, and then the feature extraction of the Mel scale cepstrum coefficient (MFCC) of the speech is fixed。 By comparing the dynamic time warping algorithm (DTW), hidden Markov model (HMM) and vector quantization (VQ) algorithm。 Finally, the vector quantization algorithm (VQ) is used to realize the recognition of a small amount of speech, which has the advantages of small amount of storage and computation。
Keywords:Mel scale cepstrum coefficient, dynamic time warping algorithm(DTW), hidden Markov algorithm(HMM),vector quantification algorithm(VQ)
目 录
1 前言 4
1。1 语音识别发展简介 4
1。2 语音识别系统概述 4
2 语音信号的前期处理 5
2。1 语音信号的预处理 5
2。2 语音信号的端点检测 6
2。3 语音信号的特征值提取 7
3 DTW算法 8
3。1 DTW算法原理 8
3。2 DTW算法流程 10
4 HMM算法 10
4。1 HMM 模型 10
4。2 HMM 模型的三个基本问题 10
5 VQ算法 13
5。1 VQ 的定义 13
5。2 失真测度 13
5。3 矢量量化器 14
5。4 矢量量化器的设计方法(LBG 算法) 15
6 算法选择与仿真结果 16
结论 17
参考文献 18
致谢 19
附录 20
1 前言
1。1 语音识别发展简介
二十世纪50年代,人们开始研究语言识别,贝尔研究所实现了世界上第一个能成功识别10个英文数字发音的系统。
在60年代末,70年代初,语音识别系统才取得本质进展。人们提出了动态时间规划(DP)和线性预测分析技术(LP),语音的建模问题能够通过线性预测分析技术得到解决。到了70年代初,语音特征长度不一致的问题通过动态时间规整算法(DTW)得到解决。特定人孤立词的语音识别一般采用动态时间规整算法。70年代,矢量量化算法(VQ)和隐马尔可夫模型( HMM )的语音识别算法被提出。
到了80年代,研究的重点开始转到了对连续语音的识别,并且提出了多级的动态时间规划识别算法,此时设计算法由模板匹配转变为统计模型。隐马尔可夫模型 (HMM) 语音识别算法的成熟和推广,使得语音识别有了重大发展。