电子文献自动朗读系统设计(2)

第一章绪论

1.1背景

曾经听到有人说过这样一句话：“语音技术将在未来十年飞速发展”！可以想到的是人的声音将成为任何软件与硬件间最自然的用户交互方式，这一在过去只能想象的事情将在不久的将来得以实现。我们的电脑可以发出和真人几乎一模一样的声音，社交通讯软件、电子邮箱、查看网页等常规计算机活动将会被语音所驱动，这样将大大的方便人们的生活。多种语言的文语合成有着特定的使用价值。现在已经开发了很多语音合成系统，但是大多数原理是对一特定的语言，比较难扩展，然而我们期望的多种语言合成系统是可以共用一个系统的，这样就能推广开来。有些语言之间本身具有很大的不同，所以对一种特定语言制作的系统很难再嫁接到别的语种上面，像在中国这样的多方言的国家，每个方言间有着自己独特的发音规则，一些相差较远的方言间是很难适用同一套发音规则的。由此可以看出，要想使这一难题变得可解，我们必须换个角度去思考问题，以求能实现我们预期。我的课题针对实际应用的需要，对很多已有的系统进行研究分析，也就是需要借鉴别人的研究来做进一步研究，虽然早已有成型的双语发音合成系统，但是我通过这次对发音的研究要达到锻炼自己的目的。[19]

1.2可行性分析

最近几年，一种新兴的依靠语音数据库的语音合成技术得到了广泛使用。这种方法是怎么实现的呢？发音的内容其实是由一个个的语音单元组成的，而这些组成部分是我们提前录制好的，然后存放在一个统一的数据库里。在我的系统中使用的就是微软的语音包 Microsoft speech sdk 5.1，可以设想，当我们存放了足够的语音单元时，这些单元包括各种可能的情况，这样一来就能读出我们给的每一个语句。由于数据库里的声音都是录制的真人说话，那么合成语句的质量问题将不会被担心。

我国的汉语语音合成研究开始时间相对于其他国家比较晚，直到 2 0 世纪 8 0 年代初期，我国汉语语音合成研究才能够基本与国际上研究接轨。我国的语音合成发展经历了哪些过程呢？包括共振峰合成、 L P C 合成到应用 P S O L A 技术的过程。在很多国家政策的支持下，我国语言的发声都有了非常非常大的进步。许多大学还有公司的相关研究成果和产品都出现了，这些都表明我国的声音合成有了飞速的发展。基于以上合成语音的发展历史以及发展现状，将文本转化为声音是可行的，而且也有很多现有的产品已经实现了。利用已有的语音包，选择合适的平台和技术，就可以实现一个好的中英文朗读系统。

1.3 语音合成技术

什么是语音合成技术呢？就是指将一系列文本内容,按系统设定的语音处理规则转换成语音信号输出，也就是机器像真人一样把文字读出来,就像聊天时听别人讲话一样。这样人们就可以不用将眼睛始终与电脑屏幕绑定，还可以适当做其他事，缓解眼睛疲劳。语音合成就是这样一个文字转语音的过程。语音合成技术是很有意义的技术，它是很有前景的，相信在不久的将来一定可以看到很多地方在使用，具有非常重要的实用价值。在平常生活中，中英双语同步混合出现的情景是非常普遍的，就在我们周围，文章昵称都有很多中英双语的现象。而本课题主要研究的是也中英文的语音合成问题。文献综述

1.3.1 语音合成的发展方向

（ 1 ）使合成语音的音质更加自然：对于汉语语音合成系统来说，目前在单个字和单个词语这一阶段上，合成语音的可懂度和自然度已经基本上得到解决，系统可以很清晰自然的朗读一个字或者词语。但是到句子或者段落甚至一整篇文章这一阶段时其自然度就大打折扣，达不到我们想要的效果，朗读结果是很生涩的，不被大多数人接受。因为它的原理是采用自然语音波形直接相连的技术，连接的单元都是数据库里已经有的，所以只能朗读的比较不连贯，无法表达一些应该有的抑扬顿挫。

上一篇：Android文件管理器设计与实现

下一篇：基于HTTP首部大小写变换网络隐蔽信道的设计与实现

电子文献自动朗读系统设计(2)

数据挖掘在电子商务中的应用

风机风量自动报警装置【517字】

电子政务环境下公务员的...

电子政务建设与民营企业...

电子政务与行政体制改革...

电子商务中信息不對称问题研究【2365字】

應用电子技术中可编程控...

LiMn1-xFexPO4正极材料合成及充放电性能研究

张洁小说《无字》中的女性意识

我国风险投资的发展现状问题及对策分析

老年2型糖尿病患者运动疗...

互联网教育”变革路径研究进展【7972字】

新課改下小學语文洧效阅...

安康汉江网讯

ASP.net+sqlserver企业设备管理系统设计与开发

麦秸秆还田和沼液灌溉对...

网络语言“XX体”研究