4。4。2 短时过零率计算 25
4。4。3 端点检测的实现 26
4。5 小结 20
结 论 27
致 谢 28
参考文献 29
1绪论
自第一台计算机诞生伊始,计算机对人类社会的生活工作模式产生了深刻的变革和影响,越来越多旨在让生产生活变得智能化的产品应景而生。在这些技术当中,语音识别技术的产生和发展有着其独特的价值。通过接收,处理,保存这一信号,人类社会的生活得到了极大的便捷以及拓展。而随着科学技术的不断进步,人们对声音的处理水平也在不断提高,从早期的保存传输,到现在的对语音进行识别分析,获取更多有用的信息。论文网
1。1 课题设计背景
在语音识别中,语音端点检测的地位相当重要。所谓信号处理中的语音端点检测技术,是指从一段指定的语音文件中区分出语音的起点和终点。这一步是进行其它语音信号识别与分析的关键一步,也是基础一步。优秀的端点检测技术的采用能够更好的分析语音信号,从而达到语音识别中的高识别率。在实际中,一般要求先分析系统输入的语音信号,有效的找出语音信号的起止点,这样可以很好的减少运算量,并且提高语音识别的正确率。 目前,语音技术取得了不小的进步,很多公司和学术研究机构在语音输入和控制领域有了新的发现。虽然语音识别的技术在软件和硬件上都在日益发展,但和我们人类本身的听力水平还相差甚远,在生产生活中的应用也才刚刚开始,建设语音输入的硬件技术、软件技术引擎,使语音识别技术能集成到更多需要语音功能的软件中去。而且语音识别产业应该有更适宜的环境,使有能力和技术的企业都能加入到语音识别的研究中,从而求得改变。
1。2 课题设计目的和任务
语音信号的特征分析是进行语音识别的基础,语音信号的时间域特征分析具有简单直观、物理意义明确的优点。研究表明,为了使得语音识别信息变得准确可靠,必须首先有效的分析出语音信号的语音段和非语音段,从而排除非语音段对语音识别信息的干扰,这种区别语音信号的语音段与非语音段的方法,就叫做端点检测。
本课题要求认识语音信号的短时平稳特征、元音的准周期性特征,提取语音信号的短时能量和短时过零率等时间域特征参数,用这两个参数分析无声段、辅音段及元音段的不同特点,并利用这两个特征参数对语音信号进行端点检测,从而自动识别语音段的起止点。
具体要求,首先要对WAV音频格式的文件深入了解,理解其中数据所表达的信息。同时要阅读文献,学习并理解语音信号时间域特征分析的原理及方法,进而理解短时能量和短时过零率等时间域特征的物理含义。在编程能力上面,要求掌握C++编程和MFC框架,设计出一个能够识别分析输入的语音文件,提取语音信号的短时能量和短时过零率参数并能够用传统双门限法进行端点检测的程序。并且最终,这些特征参数以及语音波形要以图形曲线的方式在程序中体现。
2语音信号的时间域特征分析
近年来,语音信号处理领域的研究,对语音信号的端点检测和检测的研究日益重要。作为语音识别工作的前提,端点检测方法不仅有效地降低了存储和数据处理的时间,并能排除无声段噪声,以便更准确的语音识别。目前语音信号端点检测算法比较多,有短时能量、短时过零率的分析、自相关等,其中短时能量和短时过零率利用最为广泛。本章将会从短时过零率和短时能量的概念入手,详细介绍这两种方法在语音识别中起到的作用,并比较它们各自的优缺点,从而得到一个更加优秀科学的进行语音识别分析的办法。