20世纪80年代,由于矢量量化、隐马尔可夫模型和人工神经网络(ANN)等相继被应用于语音信号处理,并经过不断改进与完善,使得语音信号处理技术产生了突破性的进展。其中,隐马尔可夫模型作为语音信号的一种统计模型,在语音信号处理的各个领域中获得了广泛的应用[11]。其理论基础是1970年前后,由Baum等人建立起来的,随后,由美国卡内基梅隆大学 (CMU)的Baker和美国IBM公司的Jelinek等人将其应用到语音识别中。由于美国贝尔实验室的Babiner等人在20世纪80年代中期,对隐马尔可夫模型深人浅出的介绍,才使世界各国从事语音信号处理的研究人员了解和熟悉,进而成为一个公认的研究热点,也是目前语音识别等的主流研究途径。
从进入90年代以来,语音信号处理在实用化方面取得了许多实质性的进展。一方面,对声学语音学统计模型的研究逐渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工神经网络的结合成为研究的热点。另一方面,为了语音识别实用化的需要,讲者自适应、听觉模型、快速搜索识别算法以及进一步的语言模型的研究等课题倍受关注。
语音信号处理在手持设备、移动设备和无线个人设备中的应用正在不断增加。今天的个人手持设备语音大多时候仅仅局限于语音拨号,但是已经出现了适用于更广泛开发语音识别和文本到语音应用的技术。语音功能为用户提供自然的输入和输出方式,它比其他形式的I/O更安全,尤其是当用户在开车期间。在大多数应用中,语音都是键盘和显示器的理想补充。其他潜在的语音应用包括如下几个方面。
(1)语音电子邮件。包括浏览、邮箱利用语音输入写电子邮件以及收听电子邮件的读出。
(2)信息检索。股票价格、标题新闻、航班信息、天气预报等都可以通过语音从互联网收听。例如,用户不用先进入某个网址并输入股票名字或者浏览预定义列表,可以通过语音命令实现。
(3)个人信息管理。允许用户通过语音指定预约、查看日历、添加联络信息等等。
(4)语音浏览。利用语音程序菜单,用户可以在网上冲浪、添加语音收藏夹并收听网页内容的读出。
(5)语音导航。在自动和人眼不够用的条件下获取导航的完全语音输入/输出驾驶系统。
语音信号的出书和存储是语音信号的基本要求。对语音信号的传输,希望是传输的速度尽量得快,传输质量尽量的高;对语音信号的存储,希望存储的空间尽量的小,存储的信息尽量的多。这两个方面的要求,促进了语音编码的产生。语音编码算法可以解决语音传输和和存储的问题。所以,研究语音编码算法,也具有十分重要的价值,是目前语音信号处理最广泛的算法。
随着数字信号处理算法在DSP中的实现,很多以前很难实现的语音信号处理算法都可以在DSP中实现。语音信号具有信号频谱较全、采样速率较低、随机性强、应用场合多、实时性要求高等特点。语音信号的处理包括信号采集、处理、传输、存储和播放这一系列的处理过程。其中,语音信号的采集、传输和播放属于对语音信号的控制,其处理过程满足一定的标准操作即可;而语音信号的处理和存储与应用对象有很大的联系,不同的应用对象所要求的处理算法和合存储算法不同。
目前语音信号的采集和分析处理主要基于仿真软件如:MATLAB仿真,以及基于DSP数字化模块处理、小波变换对语音信号的时域和频域的分析处理。 语音信号的采集与分析技术国内外研究现状(2):http://www.youerw.com/yanjiu/lunwen_16276.html