毕业论文

打赏
当前位置: 毕业论文 > 自动化 >

基于音频特征的场景检测算法设计与实现(4)

时间:2018-04-10 21:52来源:毕业论文
音频在时间域上的特征有很多,我们一般对以下几个区分度良好的特征进行分析,如短时能量,短时平均过零率等。 2.2.1 短时能量 为了描述音频信号随着


音频在时间域上的特征有很多,我们一般对以下几个区分度良好的特征进行分析,如短时能量,短时平均过零率等。
2.2.1 短时能量
为了描述音频信号随着时间变化,常常采用短时能量分析来反应幅度变化。对于信号{x(n)},短时能量的定义如下:
  (3-1)
其中, 。短时能量可以看做音频信号的平方经过一个线性滤波器的输出,冲激响应h(n)的选择,决定了短时能量表示方法的特点。
我们假设窗口的长为N,经过加窗后的短时能量可表示为
                             (3-2)
短时能量可以有效地判断信号的幅度,一般用于有声/无声判定,除此以外,噪音段的能量一般小于语音,所以,短时能量也可以用于区分语音和噪音。
2.2.2 短时平均过零率
短时过零率顾名思义是经过零的次数,它指在一帧中信号符号正负变化的次数。对连续信号来说,在波形图上信号穿越横轴的次数就是过零率。在离散的情况下,我们可以观察采样点正负号变化的次数来获得。其公式为:
             (3-3)
其中sgn[•]是符号函数,即
                         (3-4)
通过把短时能量和短时过零率相结合,我们可以很好地显示出音频信号的起止点,也就是静音段与非静音段的分割点。
2.2.3 短时自相关函数和短时平均幅度差函数
短时自相关函数是在自相关函数基础上将信号加窗获得的。
                  (3-5)
浊音的短时自相关函数呈现出明显的周期性,且与原信号本身的周期相同。清音接近于随机噪声,所以它的短时自相关函数没有周期性。
由于计算短时自相关函数需要巨大的计算量,所以我们常常采用短时平均幅度差函数来替代。对一个周期为P的单纯的周期信号做差分。
                              (3-6)
在k=0,+P,+2P,-P,-2P时,上式为零。当k与信号周期吻合时,d(n)的短时平均幅度很小,所以定义短时平均幅度差函数为
                      (3-7)
可以发现计算比短时自相关节省很多计算量。
2.3 频域分析
对音频信号的频域分析,我们常用的方法有傅里叶变换法、离散余弦变换法、线性预测分析法。
2.3.1 傅里叶变换
傅里叶变换是一种工程上有着广泛的应用,用于将信号在时频域上进行变换,由法国数学家傅里叶提出。在音频处理中,对时域上的音频信号求其傅里叶变换就可以在频域上对其进行短时分析。 基于音频特征的场景检测算法设计与实现(4):http://www.youerw.com/zidonghua/lunwen_12853.html
------分隔线----------------------------
推荐内容