中国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音识别。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。32004
进入八十年代以后,随着计算机应用技术在中国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点,发展迅速。就在这种形式下,国内许多单位纷纷投入到这项研究工作中去。
1986年3月中国高科技发展计划(863计划)启动,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在863计划的支持下,中国开始了有组织的语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。从此中国的语音识别技术进入了一个前所未有的发展阶段。论文网
现在,智能语音产业作为我国七大战略性新兴产业之一,是软件产业中为数不多掌握自主知识产权并处于国际领先水平的领域,一直受到国家各级主管部门高度重视,已被列入多项国家科技发展规划和政策支持领域。
清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。
中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。
占据中文语音市场最大份额的科大讯飞公司自1999年成立以来,申请专利68项(其中发明专利45项),获软件著作权74项,获软件产品登记61项,通过省级成果鉴定21项,公司产品和技术多次获得国内外奖项,并在2009年被认定为国家级创新型企业。同时,作为我国最大的智能语音技术提供商,在智能语音技术领域拥有多年的研究积累,并在语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。
目前,全球语音技术市场规模超过30亿美元,近年来年增长率保持在25%以上,未来语音识别市场被看好,其中电信行业(VoIP等),移动应用领域(手机、学习机、平板电脑、车载系统等移动设备),都会呈现出爆发式增长。各大搜索引擎公司也都把语音搜索作为未来重要的应用方向,投入了大量的精力进行研发和推广。比如 Google去年就推出了支持 15种语言的语音搜索软件,微软也在加快这方面的开发进度,苹果也成立了自己的语音开发团队,国内的百度、腾讯、搜狐等也正积极开展此方面的研发,并相继准备推出自己的中文语音搜索平台。此项技术还处于市场培育阶段,这些大公司都看好其未来的应用前景,抢占市场的步伐明显加快!微软在 2011年的公司内部的年会上,前所未有的大量展示了语音相关的应用,并将其列为未来几年战略规划之一,将在Windows操作系统及Office、车载系统、家庭娱乐、搜索引擎等领域广泛整合、应用语音技术。苹果公司也自其发布的IOS6以后,以语音识别为核心技术的 Siri Assistant作为其新款手机的一个最主要的卖点,并号称开创了手机应用的全新领域。Siri Assistant 是一款在一定程度上支持智能问答的系统,用户通过语音提出需求,系统通过语音识别技术,再通过搜索引擎来满足用户的要求,通过这个系统,用户可以完成基本查询、浏览、购物、预订、导航等功能,产品目标是成为人们日常生活的好助手。 语音识别技术国内外研究现状综述:http://www.youerw.com/yanjiu/lunwen_28389.html