利用语谱图可以确定说话人的本性。语谱图中不同频率上的黑白程度形成了因人
而异的“声纹” ,其就好比是每个人的指纹,即我们可以通过语谱图分辨说话人。
此外,语谱图还可以用于聋人语训,使聋人学生能够直观的了解到自己发音与标
准音的差别及改进方向。
随着语谱图的用途增多,重要性加强。在已普及的个人计算机上增加语谱图功能
也开始变得更为重要。
1.3 语音信号分析的发展概述
语音信号处理的研究,起源于对发声器官的模拟。1939 年,美国人 H.Dudley 展
出了一个简单的发声过程模拟系统。利用该模型可以对语音信号进行各种频谱及参数
的分析,同时也可根据分析获得的频谱特征或参数变化规律,合成语音信号,实现机
器的语音合成。
当今对语音信号进行研究一般都基于语音信号的数字表示,因此,语音信号的数
字表示是进行语音信号数字处理的基础。其理论依据是著名的采样定理,即只要采样
频率足够高,就可以用时域上周期抽取的样点来表示一个带限信号。语音信号的离散
表示基本上可以分为两大类:波形表示和参数表示。波形表示仅仅是通过采样和量化
的过程保存模拟话音信号的“波形” ,而参数表示则是表示波形的特性。
而对语音信号处理的研究可以从一下两个方面出发:
一是从语音产生和语音感知来研究。语音产生的研究涉及大脑中枢的言语活动如
何转换成人发声器官的运动,从而形成声波的传播。语音感知的研究涉及人耳对声波
的收集并经过初步处理后转换成神经元活动,然后逐级传递到大脑皮层的语言中枢。
语音产生和语音感知方面的研究与语音学、语言学、心理学和神经生理学等学科紧密
联系。目前,对于整个语言链的物理层已经研究的比较透彻,而对于神经元活动和大
脑语言中枢的工作原理还有待进一步研究。
二是将语音作为一种信号进行处理。20 世纪 60 年代形成的一系列数字信号处理
方法和算法,即基于采样定理,利用如数字滤波器、FFT、线性预测编码技术等对语
音信号进行分析与处理。
1.4 本文的主要任务
本课题要求利用 VC++6.0 作为编程工具,编写语音信号的频谱分析软件,要求采
用面向对象的编程方法,能够对语音信号序列做短时傅立叶变换,同时给出语音信号
的时域波形和语谱图,并在此基础上给出语音信号的一些短时特性参数,如短时自相
关函数,基音周期等。
在本文当中,主要讨论了以计算机为平台,采用 VC++编写语音信号语谱图软件的
主要设计过程。以数字信号处理理论为基础,利用 windows 自带录音机程序配合计算
机声卡对语音信号进行数字化的录制,再通过语谱图软件对语音信号数据进行提取、
转化,从而显示出语音信号的时域波形及语谱图。
论文的任务主要集中在以下三个方面:
(1)完成语谱图软件主界面的设计。主要包括程序窗口的分割与工具栏设计。
(2)完成语谱图软件时域波形部分的设计。主要包括语音文件的调用、文件有效
性判别以及时域波形的显示。
(3)完成语谱图软件语谱图部分的设计。主要包括语音文件的调用、对数据进行
分窗、转化、FFTW 对语音信号进行处理及语谱图的显示。 2. 快速傅里叶变换
2.1 短时傅里叶变换
在语音信号处理中,傅里叶表示在传统上一直起主要作用。其原因一方面在于稳 VC++语音信号语谱图软件的设计与实现(3):http://www.youerw.com/tongxin/lunwen_6610.html