目前语音分离技术的解决方式主要分成两大块:听觉场景分析和盲源分离。听觉场景分析简单来说就是对人类的听觉的心理和生理特征进行分析,找到规律并建立模型,再对模型进行分析,目标是使计算机获得同人类一样的听觉感知和分离能力[[4] 刘继芳。 基于计算听觉场景分析的混合语音分离研究[D]。 哈尔滨工程大学, 2009。][4]。由于人耳功能的复杂性等因素,如今对听觉场景分析的探究还没有太大的突破性进展,对语音分离的解决方案还是以选择盲源分离为主,再者论文第三章将比较的算法均基于盲源分离技术,故对听觉场景分析的发展现状不再做更多阐述,仅介绍盲分离技术的发展进程。80704

盲源分离技术最初的里程碑是1986年法国科学家Christian Jutten和Jeanny Herault发表的基于神经网络模型的自适应信号处理方法[[5] Herault, J, Jutten, C。 Space or time adaptive signal processing by neural network models[C], AIP Conference Proceedings 151 on Neural Networks for Computing。 American Institute of Physics Inc。 1986:206-211。][5],达成了2个信号的分离。1988年至1989年,Linsker发布了几篇关于最大互信息准则的重要文章[[6] Linsker R。 Self-Organization in a Perceptual Network[J]。 Computer, 1988, 21(3):105-117。][6]。1991年,Pierre Comon[[7] Comon P, Jutten C, Herault J。 Blind separation of sources, part II: Problems statement[J]。 Signal Processing, 1991, 24(1):11-20。][7]、Esfandiar Sorouchyari[[8] Sorouchyari E。 Blind separation of sources, part III: Stability analysis[J]。 Signal Processing, 1991, 24(1):21-29。][8]及Christian Jutten和Jeanny Herault[[9] Jutten C, Herault J。 Blind separation of sources, part I: An adaptive algorithm based on neuromimetic architecture[J]。 Signal Processing, 1991, 24(1):1-10。][9]发表了3篇有关BSS的经典论文,第一次在BSS问题中运用ANN算法,对耳部神经进行仿真模拟。1992年,Guillaume Burel使用逆传播神经网络实现了对线性及非线性合成的盲源信号进行分离[[10] Burel G。 Blind separation of sources: A nonlinear neural algorithm[J]。 Neural Networks, 1992, 5(6):937-947。][10]。1994年,Pierre Comon在改进了主分量分析(principal component analysis, PCA)的基础上提出了ICA方法[[11] Comon P。 Independent component analysis, A new concept[J]。 Signal Processing, 1994, 36(3):287-314。][11],该方法日后成为最主要的盲源分离方法。同一年,Andrzej Cichocki提出了利用高阶统计量的PCA法来解决非线性盲分离问题[[12] Cichocki A, Unbehauen R。 A new on-line adaptive learning algorithm for blind separation of source signals[C],论文网 1994。][12]。1995年,Terrence Sejnowski和A。J。 Bell利用神经网络的非线性特征以除去高阶统计相关,且开始使用信息论的观点看待BSS问题,以熵最大化标准在生成函数并以此将信息论和独立分量分析联系在一起,给出了一类自适应的盲分离方法[[13] Bell A J, Sejnowski T J。 An information-maximization approach to blind separation and blind deconvolution。[J]。 Neural Computation, 1995, 7(6):1129-59。][13]。1996年,Jean Francois Cardoso和Beate Hvam Laheld提出了ICA方法中的“等变化特性”与“相对梯度”等概念和如何提高分离的准确性和稳定性的方式[[14] Equivariant adaptive source separation[J]。 Signal Processing IEEE Transactions on, 1996, 44。][14]。同一年,Barak Pearlmutter提出了最大似然估计法(Maximum Likelihood,ML)[[15] Pearlmuttery B A, Parraz L C。 A Context-Sensitive Generalization of ICA[A]。 Proc。 Int。 Conf。 Neural Information Processing, ICONIP’96[C]。 Hong Kong, 1996: 151-157。][15]。次年,Jean Francois Cardoso证明了ML法和熵最大法是等同的[[16] Cardoso, Jean-Franois。 Infomax and maximum likelihood for blind source separation[J]。 IEEE Signal Processing Letters, 1997, 4(4):112-114。][16]。1998年,Aapo Hyvarinen利用观测信号的峭度(4阶累积量),给出了一种定点算法[[17] Hyvärinen A, Oja E。 A Fast Fixed-Point Algorithm for Independent Component Analysis[J]。 Neural Computation, 1997, 9(7):1483-1492。][17]。在1999年到2004年期间,共举行了5届ICA&BSS国际会议。2000年,Harri Valpola在会议上发表基于贝叶斯集合学习法的非线性独立分量分析方法[[18] Lappalainen H。 NONLINEAR INDEPENDENT COMPONENT ANALYSIS USING ENSEMBLE LEARNING : THEORY[C], In Proceedings of the International Workshop on Independent Component Analysis and Blind Signal Separation。 2000:93--121。][18]。Ki-Seok Cho和Soo-Young Lee于2001年设计了专门的COMS芯片来达成著名的信息最大化自然梯度算法[[19] Cho K S。 Lee S Y。 Implementation of Infomax ICA algorithm with analog CMOS circuits[A]。 Proc。 ICA2001[C]。 San Diego, CA。 USA。 2001: 70—73。][19]。2003年,Jean Francois Cardoso独创性地提出将独立分量分析用于天文学领域的图像[[20] Cardoso J F, Delabrouille J, Patanchon G。 Independent Component analysis of the Cosmic Microwave Background[J]。 Proc of Ica’, 2004, 57(4):1111--1116。][20]。Zhijian Yuan和Erkki Oja于2004年给出了一个在非负ICA情况下使用的FastICA算法[[21] Yuan Z, Oja E。 A FastICA Algorithm for Non-negative Independent Component Analysis[C], Independent Component Analysis and Blind Signal Separation, Fifth International Conference, ICA 2004, Granada, Spain, September 22-24, 2004, Proceedings。 2004:1-8。][21]。一直到近来几年,在国际权威的声学杂志与会议上,每年都会出现大量有关BSS的文章。大量学者提出了许多关于BSS的算法,论述了盲源信号分离的技术与理论。

上一篇:玻璃膜疣可视化研究现状
下一篇:Android应用自动化测试国内外研究现状

多媒体技术对教学影响的国内外研究现状

3D打印技术国内外研究现状和参考文献

生态浮床技术国内外研究现状

HTML5三维全景展示技术国内外研究现状

语音识别系统国内外研究现状及发展趋势

转向架安全监测技术的研究现状

激光焊接的技术研究现状

张洁小说《无字》中的女性意识

新課改下小學语文洧效阅...

互联网教育”变革路径研究进展【7972字】

老年2型糖尿病患者运动疗...

我国风险投资的发展现状问题及对策分析

网络语言“XX体”研究

安康汉江网讯

ASP.net+sqlserver企业设备管理系统设计与开发

LiMn1-xFexPO4正极材料合成及充放电性能研究

麦秸秆还田和沼液灌溉对...