1.2 基于麦克风阵列的定位方法 3
1.2.1 基于最大输出功率的可控波束形成的定位方法 3
1.2.2 基于高分辨率谱估计技术的定向方法 4
1.2.3 基于到达时间差(TODA)的定位方法 4
1.3 国内外系统研究进展 5
1.4 论文结构安排 6
2 麦克风阵列理论基础 6
2.1 声源信号模型 6
2.1.1 语音信号 7
2.1.2 噪声信号 7
2.2 近场模型与远场模型 8
2.2.1 声波传播特性 8
2.2.2 近场模型 9
2.2.3 远场模型 9
2.3 麦克风阵列的几何拓扑 10
2.3.1 麦克风阵元间距 10
2.3.2 麦克风阵元个数 10
2.3.3 麦克风种类 11
2.3.4 麦克风阵的结构类型的选择 11
2.4 本章小结 12
3 麦克风阵列的延时估计 12
3.1 麦克风信号产生模型 12
3.2 时延估计算法的分类 13
3.3 广义互相关延时估计法 14
3.4 自适应延时估计法[41] 15
3.5 本章小结 16
4 仿真定位实验 16
4.1 平面四元十字阵的定向原理 17
4.2 平面四元十字阵的定向精度分析和数值仿真 18
4.2.1 平面四元十字阵的定向精度分析 18
4.2.2 数值仿真 19
4.3 本章小结 24
5 总结与展望 24
5.1 全文总结 24
5.2 本文的不总之处及展望 24
致 谢 26
参考文献 27
1 绪论
1.1 麦克风阵列简述
麦克风声源定位技术是利用麦克风拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。传统的单个麦克风的拾音范围有限,拾取的信号质量不高,因此提出了用麦克风阵列进行语音处理的方法。麦克风阵列具有去噪、声源定位和跟踪等功能。从而大大提高了语音信号的处理质量。而麦克风等传声器本身并没有向外界辐射电磁波。因此,其更为良好的安全性及隐蔽性,成为了研究人员开展声源定位技术的目标。声源定位技术的研究对于下述邻域的研究工作都有着实质性的促进作用:
1)军事应用
由于声源定位技术的特殊性使其在军事邻域得到了广阔的应用。当今战争中的武装直升机、巡航导弹等低空飞行物所设计的声探测武器,就是利用了被动声探测技术及声源定位技术。
2)视频会议
声源定位的另一用途为视频会议中的说话人定位。传统的视频会议中,声音采集设备,如麦克风、摄像头等设备是固定的设备。因此,说话人被固定在麦克风周围进行演讲。从而降低了报告人在空间中的自由性。因此,如果能使说话人可以自由的在会议室内移动,同时摄像头可以对说话人进行跟踪定位,使说话者处于镜头内合适的位置,便成为了各个研究院及多媒体公司的一个重要研究内容。斯坦福大学、麻省理工学院、微软及IBM等公司或研究院所都在这一邻域内进行着探索并取得了一定的研究成果。Polycom公司的 摄像机利用麦克风阵列技术实现的 来控制摄像头的动作来达到跟踪说话人这一功能。