语音信号采集与分析程序技术能够那样长期地、深深地吸引许多科学研究者去不断地对其进行研究和探讨,除了实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系,并且一起发展。对语音信号采集与分析的研究一直是数字信号处理技术发展的重要推动力量。因为许多处理的新方法的提出,首先是在语音信号处理中获得成功,然后再推广到其他领域。可见,语音信号采集与分析程序技术的研究将是一项极具市场价值和挑战性的工作。我们如今进行这一领域的研究与开拓就是要让语音信号处理技术走入到人们的日常生活当中,并不断朝更高目标而努力。
1.2 国内外研究现状与水平
1.3 今后发展趋势
语音合成方向:公共交通自动报站,各种场合的自动报时,自动告警等,文本校对中的语音提示,电话查询服务;与Internet结合,有声Email,网上信息的有声获取,语音聊天等;与机器翻译技术结合的语音翻译;与图象,视频技术结合的视觉语音。
语音编码方向:数字通信,移动通信,保密语音通信;呼叫服务(数字录音电话,语音信箱等)。
近二十年来,其中语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
日本一些大企业,如东芝、松下、日立等目前已经宣布在不久的将来将能产生出一种能用语言控制的打字机。由日本人首先生产一台日语打字系统这并不奇怪,因为这与日语本身的特点有关而要生产一台西方语言打字机系统那就困难多了,因为西方语言由几千个音节组成。但是即便如此,IBM公司还是实现了一个5000字(单个语音)识别系统,正确率达95%[12]。Xerox实现的Kurzweil语音系统可识别10000字。像目前水平那样仅仅识别几十个是不够的应能识别由更多重要字组成的字集。由于处理自然语言时用的音节解码技术有了发展,估计美国的Arpa-Su计划很快将会导致商业产品出现。剩下的关键问题是如何使这样的一个系统能很快适用于任何种新的语言和新的语者。
另外ANN在语音识别中的应用是目前研究的热点。该网络本质上是一个自适应非线性动力学系统,模拟了人类大脑神经元活动的基本原理,具有学习、记忆判断、联想、对比、推理、概括等能力。与HMM和ANN相比,DTW是较早的一种模式匹配和模型训练技术,它应用动态规划法成功地解决了在语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好的性能。但由于它不适合连续语音大词汇量语音识别系统,目前已被HMM和ANN所代替。
1.4 本文主要工作
本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与频谱分析、时域分析等,分析语音信号的特性,并通过录音机录制自己的一段声音,运用Matlab进行仿真并进行分析,最后在此基础上对实际采集的一段含噪声语音信号进行了相关分析处理,并进行语音信号的前后变化的比较。第2章主要介绍语音信号处理的基本理论知识包括语音信号的特点与采集等。第3章主要是语音信号的采集,录入和打开,采样以及语谱图的分析。第4章是对语音信号进行时域、频域上的分析,如短时功率谱,短时能量,短时平均过零率,语谱图分析以及语音信号的进一步综合分析,包括语音信号的定点分析与语音信号滤波分析、比较等等。
2 语音信号处理理论知识
2.1 语音信号和倒谱的简介
语音具有成为声学特征的物理物质[1],基本的组成单位是音素。因素是发出各不相同音的最小单位,可分为浊音和清音两大类。若把不存在语音而只有背景噪声的情况称为无声时,音素可分为无声、浊音和清音三大类。一个音节由元音和辅音构成。元音在音节中占有主要部分,所有元音都是浊音。语音信号处理的目的有两个[2]:一是要通过处理得到一些反应语音信号重要特征的语音参数,以便高效地传输或储存语音信号信息;二是要通过处理某种运算以达到某种用途的要求,如辨识出讲话者,识别出讲话的内容等。 基于MATLAB的交通语音采集和分析程序设计(3):http://www.youerw.com/tongxin/lunwen_16275.html