1。3 发展趋势
在近几年中,不断借助计算机学习领域的深度学习研究发展,以及关于大数据语料的积攒累积,语音识别科技已经有了突飞猛进的快速发展。
语音识别技术已经成为了一个相当活跃的科研领域。在不久的将来,语音识别技术非常有可能成为一种关键的人机交互方式,辅助甚至代替传统的键盘、鼠标等输入设备,在个人计算机的使用上进行文字输入和操作控制。而在于手持式PDA、智能家电、工业现场控制等不同的应用场合,语音识别技术则拥有更为宽广的发展前景。【3】
在计算机学习领域,对语音识别进行了深入的研究,对多层神经网络进行了RBM前训练的训练,大大提高了声模型的准确性。在这方面,微软公司的研究人员首先取得了重大突破,他们使用了深度神经网络模型(DNN),在过去二十年中,语音识别错误率大大降低了30%,这是语音识别技术的最大发展方向。
目前,大多数主流语音识别译码器已经应用基于有限状态机(WFST)解码网络,该网络将能够解码语言模型和声学声音词词典和共享设置集成到一个独立解码网络,这将大大提高解码速度和提供了一个良好的实际使用语音识别技术的基础。
互联网时代的快速发展,移动终端的广泛使用和手机等,可以得到大量的文本或语音数据目前从不同渠道的多元化,这是语言模型和声学模型的语音识别技术训练提供充足的研究资源,使得大规模的建设一般语言模型和声学模型所有可能的。在语音识别技术,训练数据,和丰富的多样性是提高系统性能的最重要的因素之一,但识别和分析数据的积累和沉淀需要更长一段时间,随着大数据的时代,一个大型语料库资源的积累将进入到一个战略高度。
在最后阶段,最火的使用语音识别服务在移动终端、语音聊天机器人,互动工具,语音助理和其他计算机网络公司在源源不断出现,许多人都投入了大量的人力、物力和财力进行操作和在这一领域的研究,目的是通过小说和交互式语音方便大量客户迅速占领模式。
目前,国外的应用程序已经由苹果的Siri主导。
在中国,云所熟悉的声音,iFLYTEK,SinoVoice,grand,purplewinter诠释,百度voice,搜狗语音助理系统也使用语音识别技术,市场和其他相关产品直接或间接嵌入语音识别技术类似或相同。