语音识别系统国内外研究现状和发展趋势(2)
时间:2017-03-19 13:56 来源:毕业论文 作者:毕业论文 点击:次
然而,进入90年代之后,由于当时硬件条件的限制,语音识别未能取得迅速发展。相反,文字识别、图像处理逐渐成为技术发展的主流。 随着时间进入21世纪,互联网技术的高速发展,云计算技术的兴起,使得移动平台的语音识别成为可能。2011年,苹果公司率先发布其智能移动语音识别系统Siri。随后,各大移动平台或终端厂商,如Google、Motorola、Samsung等也积极在其终端或平台推出语音识别服务。这些语音识别服务的特点是,识别过程都不在终端完成,而是进行简单的数据提取后发往云端,依靠云端强劲的计算能力,在很短的时间内以很高的正确率返回识别结果,并根据识别结果(文字)做出相应的反应(指令),从而实现语音识别的智能化。 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。 中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。安徽科大讯飞公司在今年已成功上市,并发布了基于Android平台自主研发的汉语语音识别系统—讯飞语音云,标志着中文语音识别大范围民用化的开始。 如果从识别系统的词汇量大小考虑,也可以将识别系统分为3类:(1)小词汇量语音识别系统。通常包括几十个词的语音识别系统。(2)中等词汇量的语音识别系统。通常包括几百个词到上千个词的识别系统。(3)大词汇量语音识别系统。通常包括几千到几万个词的语音识别系统。随着计算机与数字信号处理器运算能力以及识别系统精度的提高,识别系统根据词汇量大小进行分类也不断进行变化。目前是中等词汇量的识别系统到将来可能就是小词汇量的语音识别系统。这些不同的限制也确定了语音识别系统的困难度。 (责任编辑:qin) |