摘要声源定位算法是信号处理领域的研究热点,神经网络作为人工智能的分支具有极其广泛的应用前景。本文将双耳语音定位问题视为一个多分类的问题,训练一个顶层为softmax回归结构的神经网络,输出声源处于每个方位的概率,取最大概率为声源位置。在处理定位问题时,本文提取的双耳特征线索是互相关函数CCF和耳间强度差IID。在实验中,本文选取了定位准确率作为评价标准,使用了计算机合成的双耳语音信号,在多种混响和噪声环境下进行仿真,将本文提出的算法与经典GCC算法及子带SNR估计算法进行了比较。75464
针对以往算法定位性能不佳的问题,本论文采用的BP神经网路实现定位,实验结果表明该网络能够有效改善定位性能,具有实用性。
毕业论文关键词 声源定位 神经网络 双耳线索 BP算法
毕业设计说明书外文摘要
Title Research of Binaural Localization Algorithm Based on Neural Network
Abstract Speech localization is a hot field of signal processing, neural networks algorithm, as a branch of artificial intelligence, has a vast application prospects。
This thesis treat binaural localization problem as multiclass classification task。 We train a neural network whose top layer is softmax regression to predict probabilities of each direction and then the direction with maximal probability is considered as sources's location。 For localization, binaural features of cross correlation function and interaural intensity difference are used。 We choose localization accuracy as evaluation criterion。 Speeches composed by computer are used in experiments to compare performance of the classical GCC algorithm and sub-band SNR estimation algorithm。
For conventional algorithms' poor localization performance issues, this paper uses BP neural network to localize, experimental results prove that the network can effectively improve the localization performance with feasibility。
Keywords Binaural localization; Neural Networks; Binaural cue; BP Algorithm
目 次
1 绪论 1
1。1 声源定位的研究背景及意义 1
1。2 声源定位的研究方法概论 2
1。2。1 麦克风阵列 2
1。2。2 听觉场景分析 3
1。3 本文主要研究内容 3
1。3。1 基于双耳线索的特征提取 3
1。3。2 基于神经网络的声源定位 4
1。4 本文组织结构 4
2 基于双耳听觉的声源定位介绍 5
2。1 人类的听觉系统 5
2。1。1 人耳的生理结构 5
2。1。2 听觉系统的感知机理 6
2。1。3 空间听觉 6
2。1。4 空间坐标系统 7
2。2 双耳空间定位线索 7
2。2。1 耳间时间差 8
2。2。2 互相关函数 9
2。2。3 耳间强度差