语音信号处理技术国内外研究现状和发展趋势_毕业论文

毕业论文移动版

毕业论文 > 研究现状 >

语音信号处理技术国内外研究现状和发展趋势

语音信号处理技术是计算机智能接口与人机交互的重要手段之一。从目前整个的信息化建设的发展中,语音技术有很多的应用。其中包括语音识别、说话人的鉴别和确定、语种的鉴别和确认、关键词检测和确认、语音合成、语音编码等。语音数字信号处理也即DSP是通信、人工智能等学科的一重要分支和应用,不仅在各企业和研究所也包括各高校在内的都有大量的人员去涉及到语音数字信号处理的教学和研究。20117
(1) 语音识别技术的发展趋势
首先对于说话人识别技术,近年来已经在安全加密、银行信息电话查询服务等方面得到了很好的应用。此外,说话人识别技术也在公安机关破案和法庭取证方面发挥着重要的作用。其次对于语音识别技术而言,在一些领域中正成为一个关键的具有竞争力的技术。例如,在声控应用中,计算机可以识别输入的语音内容,并根据内容来执行相应的动作,这包括了声控电话转换、声控语音拨号系统、声控智能玩具、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、医疗服务、股票服务和工业控制等。在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”;使用电话与通信网络,人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大的障碍。再者,语音信号处理还可用于自动口语分析,如声控打字机等。随着计算机和大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交互机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包含了语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。
(2) 语音合成技术的发展趋势
就语音合成而言,它已经在许多方面取得了实际的应用并发挥了很大的社会作用,例如,公交汽车上的自动报站、各种场合的自动报时、自动报警、手机查询服务和各种文本校对中的语音提示等。在电信声讯服务中的智能电话查询系统中,采用语音合成技术可以弥补以往通过电话进行静态查询的不足,满足海量数据和动态查询的需求,如股票、售后服务、车站查询等信息;也可用于基于微型机的办公、教学、娱乐等智能多媒体软件
国内外研究现状
语音技术的最初的研究工作可以追溯1940年前后Dudley的声码器(vocoder)和Potter等人的语音研究开始。1952年贝尔(Bell)实验室的Davis等人首次研制成功能识别十个英语数字的实验装置。1956年Olson和Belar等人采用8个带通滤波器组提取频谱参数作为语音的特征,研制成功一台简单的语音打字机。20世纪60年代初由于Faut和Steven的努力,奠定了语音生成理论的基础,在此基础上语音合成的研究得到了扎实的进展。20世纪60年代中期形成的一系列数字信号处理方法和技术,如数字滤波器、快速傅利叶变换(FFT)等成为语音信号数字处理的理论和技术基础。
到了1971年,以美国ARPA(American Research Projects Agency)为主导的“语音理解系统”的研究计划也开始起步。这个研究计划不仅在美国国内,而且对世界各国都产生了很大的影响,它促进了连续语音识别研究的兴起。20世纪80年代,由于矢量量化、隐马尔可夫模型和人工神经网络(ANN)等相继被应用于语音信号处理,并经过不断改进与完善,使得语音信号处理技术产生了突破性的进展。从50年代到90年代之间,语音识别和分析的相关技术都在稳步的前进,在语音技术的系统框架上面并没有重大的突破,但其在实际的应用领域取得了长足的进展。如美国在DARPA计划中,积极的推进了语音在自然语言处理部分的应用。于此期间,通过在机器人上运用语音技术以及不断的将语音技术运用于银行、电信等众多行业上,使得语音技术的应用愈加的广泛。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域,一些用户交换机、电话机、手机已经包含了语音识别的功能,人们可以通过这些方便快捷的用户端设备来查询、了解和获取所需要的信息内容。 (责任编辑:qin)