摘要针对现有话音活动检测算法在低信噪比环境下抗噪性能不佳这一情况,本文为话音活动检测研究提供了一种具有鲁棒特性的双麦克风算法,该算法适用于检测随机方向传来的话音。基于复指数二阶和四阶累积量的统计特性,得到话音活动检测的度量标准。通过将这一统计特性应用在复子带域上,该算法能够有效地检测话音段并且将其从非谐波噪声中区分开来。计算机仿真结果表明,所提出的方案在区分语音段和非语音段是可行的,对于高斯型噪声以及真实记录的噪声甚至在低噪声情况下都有较好的检测能力。25846
关键词 话音活动检测 高阶统计量 累积量 双麦克风
毕业论文设计说明书外文摘要
Title A DUAL-MICROPHONE SUBBAND-BASED VOICE ACTIVITY DETECTOR USING HIGHER-ORDER CUMULANTS
Abstract
The performance of the existing speech activity detection algorithm is not good
For the low SNR environment. So this paper proposes a robust dual-microphone algorithm for Voice Activity Detection (VAD) suitable for detecting speech arriving from random directions. The algorithm is based on the use of higher order statistics (HOS) in the complex subband domain in order to effectively detect voicing segments and distinguish them from nonharmonic noise. Metrics based on new established properties of the 2nd and 4th-order cumulants of complex exponentials are derived. The pros and cons of each of these are analyzed and validated through simulation in various SNR conditions. The results show the proposed scheme is effective in discriminating voiced speech segments, and is robust to Gaussianlike and real-life recorded noises, even in low SNR.
Keywords VAD HOS cumulants dual-mics
目 次
1 绪论…1
1.1 课题研究内容及意义 1
1.2 话音活动检测发展现状及问题 2
1.3 本文主要工作和结构安排 2
2 话音活动检测原理 4
2.1 二阶和四阶统计量… 4
2.2 指数延迟信号的交叉累积量… 5
2.3 基于子带的话音活动检测度量标准 6
2.4 基于帧的话音活动检测度量标准… 7
2.5 话音活动检测算法… 8
3 实际数据采集与处理… 10
3.1 数据采集过程… 10
3.2 实测数据预处理 15
4 实验仿真与评估… 17
结论 26
致谢 27
参考文献28
1 绪论
1.1 本课题研究内容及意义
语音,顾名思义就是语言的声音,它是由发声器官发出的,包含着一定的语言意义,承载着某些社会功能,是人与人之间沟通交流的最基本手段。为了更好地获取语音信号中所包含的信息,需要对语音信号进行适当的处理,这些处理手段包括语音识别、语音增强、语音合成等。因此语音信号处理就显得尤为重要,话音活动检测作为语音信号处理的一项重要环节,更具备其不可替代的重要作用。
语音活动检测(Voice Activity Detection, VAD)又称语音端点检测,语音边界检,是指在噪声环境中检测语音的存在与否,通常在处理接收到的一段声音信号的时候,需要判断其中是否含有除了噪声以外的有用语音信号,然后再判断对这段声音信号需不需要处理,从而能够排除无用噪声信号的干扰,提高语音处理的正确率,缩短语音处理所需的时间提高工作效率。近年来出现了许多基于不同特性的话音活动检测算法,包括最大似然估计[1]、倒谱特性[2]、基于谱熵的低信噪比算法[3]、基于软计算算法[4]等,虽然这些算法在实验室等较为安静的地方都取得了不错的检测率,但是在实际情况中由于环境噪声等各种因素的影响,话音活动检测率下降非常明显,因此作为语音处理系统的前端,话音活动检测的重要性不言而喻,后续工作能否进行,直接与话音活动检测准确率相挂钩,如何快速并且正确检测出语音端点仍然是当今世界的一项难题。
- 上一篇:基于麦克风阵列的室内混响时间盲估计技术研究
- 下一篇:基于幅度差及相位差融合的多通道声源分离技术研究
-
-
-
-
-
-
-
上市公司股权结构对经营绩效的影响研究
现代简约美式风格在室内家装中的运用
NFC协议物理层的软件实现+文献综述
g-C3N4光催化剂的制备和光催化性能研究
巴金《激流三部曲》高觉新的悲剧命运
浅析中国古代宗法制度
C++最短路径算法研究和程序设计
江苏省某高中学生体质现状的调查研究
中国传统元素在游戏角色...
高警觉工作人群的元情绪...