1。4 论文结构
第1章 绪论,本章主要介绍了研究意义、现状、主要内容以及论文的主要结构;
第2章 语音增强的基础知识,简单介绍谱减法与wiener滤波法的基本概念;
第3章 简单介绍了基于DSP芯片的语音增强系统,主要对谱减法与wiener滤波法的语音增强算法进行仿真;
第4章 总结与展望。
2 语音增强的基本知识
语音信号处理是综合性很强的一门学科,其原理是利用数字信号处理技术对语音信号进行一系列的处理,由四个主要模块组成,主要包括语音合成,语音识别,语音增强和语音编码。每个分支的研究目标都不相同,这样就有多种多样的处理方法供我们采用,不过,正确利用语音信号携带的信息才是处理语音信号的目的,用简单的方法来解决实际的问题,这就需要对语音信号处理简单地叙述一下。
2。1 语音的产生
肺部呼出的稳定气流是产生语音的能量。阀门是声带,即振动部件。声带振动会发生声音,就是基本的声源。每次开启到闭合的时间为一个振动周期,即基音周期,基音频率是其倒数,简称基频。声音频率的高低就由基频来决定,其具体情况由发音人的性别、年龄决定。语音中分浊音和清音,浊音由声带发出,轻音为其他源发出。
咽、口腔和鼻腔共同组成了声道,相当于是分布参数系统,某一频率放大时必然会衰减一些其它的频率分量。比如说话时,我们的舌头会一直运动,这样来带动声道的外形和尺寸,来变化声音的频率,这就是在变化谐振的每秒变化的次数。声音门路脉动序列包含着许多的谐波,而每秒变化的次数成分和声音通道的共同振动次数就可以相互影响,这样就可能会影响到音质。
2。2 人的听觉特性
说和听这两个方面基本就能组成语音通信系统,正常情况下人的听觉系统十分灵敏,人可接受的频率为:0。016kHz~16kHz 。当人耳同时听到两个响度不同的声音时,响度高的感受远高于响度低的,响度低的变得不易觉察,这就是掩蔽效应(Masking effect)。
2。3 语音信号产生的数字模型
空气流激励声道产生语音,通过嘴唇和鼻孔发出,振动产生的语音声波利用介质来传播。数学模型可以满足目前绝大多数的研究和应用的要求,激励源、声道模型和辐射模型这三个部分可以组成一般模型。
图2-1 语音信号产生的数学模型
2。3。1 激励源模块
一般来说激励来源可分为浑浊声音和清楚声音,利用两者的开关能分辨出话语是其中哪个。为了让浊音的激励信号同样具有实际的波形,需要基因频率通过声门脉冲模型。而噪声机器会随机产生清音激励信号。文献综述
2。3。2 声道模型
一些均匀截面积的声管级联可以模拟为声道,利用流体力学的方法进行推导,N节级联的系统函数就是一个N阶的全极点函数,声道模型如公式(2-1)所示:
(2-1)
其中p是全极点过滤谐波仪器的阶, =1, 为实数。p 变大,模块的传达关系式也会越接近于声道真正传输关系式,但也会提高计算的难度。
2。3。3 辐射参考模块
嘴与嘴唇是声音传达通道的末端,所以辐照参考模块需要与嘴型相关。而口唇端的辐射在高频端的影响比较显著,低频端时影响很小。口唇的辐射效应如公式(2-2)所示:
(2-2)