摘要声源定位算法是信号处理领域的研究热点,神经网络作为人工智能的分支具有极其广泛的应用前景。本文将双耳语音定位问题视为一个多分类的问题,训练一个顶层为softmax回归结构的神经网络,输出声源处于每个方位的概率,取最大概率为声源位置。在处理定位问题时,本文提取的双耳特征线索是互相关函数CCF和耳间强度差IID。在实验中,本文选取了定位准确率作为评价标准,使用了计算机合成的双耳语音信号,在多种混响和噪声环境下进行仿真,将本文提出的算法与经典GCC算法及子带SNR估计算法进行了比较。75464

针对以往算法定位性能不佳的问题,本论文采用的BP神经网路实现定位,实验结果表明该网络能够有效改善定位性能,具有实用性。

毕业论文关键词  声源定位  神经网络  双耳线索  BP算法 

毕业设计说明书外文摘要

Title     Research of Binaural Localization Algorithm Based on  Neural Network                                   

Abstract Speech localization is a hot field of signal processing, neural networks algorithm, as a branch of artificial intelligence, has a vast application prospects。

This thesis treat binaural localization problem as multiclass classification task。 We train a neural network whose top layer is softmax regression to predict probabilities of each direction and then the direction with maximal probability is considered as sources's location。 For localization, binaural features of cross correlation function and interaural intensity difference are used。 We choose localization accuracy as evaluation criterion。 Speeches composed by computer are used in experiments to compare performance of the classical GCC algorithm and sub-band SNR estimation algorithm。

For conventional algorithms' poor localization performance issues, this paper uses BP neural network to localize, experimental results prove that the network can effectively improve the localization performance with feasibility。

Keywords  Binaural localization; Neural Networks; Binaural cue; BP Algorithm

目   次

1  绪论 1

1。1  声源定位的研究背景及意义 1

1。2  声源定位的研究方法概论 2

1。2。1  麦克风阵列 2

1。2。2  听觉场景分析 3

1。3  本文主要研究内容 3

1。3。1  基于双耳线索的特征提取 3

1。3。2  基于神经网络的声源定位 4

1。4  本文组织结构 4

2  基于双耳听觉的声源定位介绍 5

2。1  人类的听觉系统 5

2。1。1  人耳的生理结构 5

2。1。2  听觉系统的感知机理 6

2。1。3  空间听觉 6

2。1。4  空间坐标系统 7

2。2  双耳空间定位线索 7

2。2。1  耳间时间差 8

2。2。2  互相关函数 9

2。2。3  耳间强度差

上一篇:大规模MIMO系统导频分配与优化
下一篇:HFSS的Ka波段低副瓣天线阵列设计

5d电子体系的晶体场效应与自旋轨道耦合

基于Java的串口通信设计

基于Kinect的深度图像编码

Gerchberg-Saxton相位恢复算法原理及应用研究

PSpice的电容式加速度计闭环反馈控制模块设计

基于混沌的数字图像加密技术研究

HFSS频率选择表面的设计仿真与分析

ASP.net+sqlserver企业设备管理系统设计与开发

互联网教育”变革路径研究进展【7972字】

麦秸秆还田和沼液灌溉对...

老年2型糖尿病患者运动疗...

张洁小说《无字》中的女性意识

安康汉江网讯

网络语言“XX体”研究

我国风险投资的发展现状问题及对策分析

LiMn1-xFexPO4正极材料合成及充放电性能研究

新課改下小學语文洧效阅...