语音识别与键盘相比,首先更快,其次,与后者相比,前者不用训练,适用范围更加广泛,这可以说是老年人的福利了。可以预见,在不久的将来语音识别技术将会使人类的未来生活产生巨大的变革。
目前,人类基于语音识别技术,已经开发出各种语音程序如语音输入、语音拨号。
1。4 国内外语音识别技术发展现状
语音识别技术作为一种新兴技术,以其便捷性在世界范围内赢得很大的欢迎,并且得到各国政府的大力支持。
在国内,随着“863”计划的开启,语音识别技术得到我国的大力支持,并得到我国的专家有组织的研究,准确率达到90%以上的非特定人连续语音听写系统和汉语语音人机对话系统,已被我国中科院研制成功。我国的语音识别技术进入了新阶段。
在国外,类似于中文听写系统Vi-aVoice的语音识别系统被IBM等公司相继推出,而且Vi-avoice对于新闻语音识别精度较高,是现如今比较有代表性的汉语连续语音识别系统。
2009以来,随着机器领域的发展,声学、语音学、计算机、信号处理、人工智能等领域的深入研究,大量的语音数据被记录,语音技术日新月异,在技术上面微软公司采用DNN模型,从而语音识别错误率降低了30%,解码网络方面则是采用WFST,将语言模型、词典和声学共享音字集统一集成为一个大的解码网络,将计算机的等待空余时间大大减少,从而大大提高语音识别的速度。
在语音识别应用方面,更是深入人类的日常生活。这点体现在手机这些移动终端上,如语音输入、语音定位和语音拨号,目前我国的讯飞。搜狗、百度等互联网IT巨鳄都采用目前国际上最新的语音识别技术,别的产品也都或多或少自带语音识别技术。
虽然语音识别技术取得不小进步,但是本身还是有较多短板需要完善的,例如识别环境的噪声、说话人的不同、说话人的方式、传输通道等问题是我们亟待解决的。
1。5 论文的主要工作
本课题基于语音识别的智能裁判哨声识别器研制,目标是能够应用matlab平台编写仿真程序。主要任务如下:
第一, 介绍识别器设计思路;
第二, 收集录制哨声做成数据库;
第三, 成功地实现仿真测试。
2 语音识别技术三个模块的简单介绍
2。1 语音识别的步骤
语音识别技术与其他的信号处理一样,将进行录制语音、播放语音、预处理、滤波、特征提取以及识别的操作步骤。语音识别流程图如2-1所示:
图2-1语音识别流程图
2。2 采集模块源F于K优B尔C论V文N网WwW.youeRw.com 原文+QQ752^018766
特征本模块包括两部分,首先是录制语音,这段工作将有电脑本身附带的功能负责,然后是播放语音,这段工作将有matlab的wavread播放被录制的语音,并且会记录下该语音的波形图。
2。3 处理模块
该模块包括预处理、滤波、特征提取三个步骤。
2。3。1 预处理
对前面录制的语音的波形进行处理,具体步骤如下
去除噪声:尽可能的去除识别环境的噪声,保留后续处理需要的语音;
端点检测:确定语音的起止,排除无用语音,为后续处理保留需要的语音。
而这次端点检测使用双门限前端检测,利用的参数有短时能量和短时过零率,该方法考虑到语音出现后较大的浊音,设置个较高的门限来确定语音的开始,再取个比较高稍低的门限,以确定真正的起止点和结束点。