国内研究现状在国内语音情感识别的起步相对较晚,从事这一领域研究比较有代表性的研究单位主要有上海交通大学,中国科学院声学所,东南大学,南京大学声学所,北京工业大学,北京大学以及微软亚洲研究所等。其中东南大学无线电工程系的赵力等人在2001年首先提出语音信号中的情感识别研究,并采用主元分析法进行语音情感识别的深入研究;清华大学计算机系的蔡永莲等人也进行了汉语普通话情感识别的研究,他们研究了韵律特征在汉语普通话中情感识别的作用,并采用高斯混合模型和概率神经网络模型作为分类器,使得情感识别率比较理想;另外,2003年中国科学院自动化所等相关单位在北京举行了第一届中国情感计算及智能交互学术会议[3],2005年该单位又举办了国际情感计算及智能交互学术会议,将国内甚至国际这个领域的知名研究者汇聚一堂,进行学术交流,交流各自的研究进展,为情感计算和情感语音识别在中国的研究推广做了较大的贡献。67257
2 国外研究现状
在国外,研究最活跃的是MIT媒体实验室以及国际语音通信协会(ISCA)。2000年ISCA在北爱尔兰的贝尔法斯特召开了一个称为“语音与情感:研究的概念框架”的研讨会,使众多不同领域的研究者聚集一起讨论语音情感识别问题,为语音情感识别的研究做出巨大贡献,现在该协会每两年举办一次的Eurospeech或Interspeech国际会议[3],是语音研究领域非常出名的大会。国外的相关研究也非常多,其中英国贝尔法斯特女王大学[6]的教授侧重于心理学和语音分析,他们在情感感知和情感识别方面做了大量的研究,创建了世界上第一个具有高自然度的情感语音库,并开发了一个称为feeltrace的工具来记录人们从语音中感受到的情感信息;美国麻省理工媒体实验室的情感计算小组是世界上第一个大规模研究情感及其计算的研究机构,他们开发出了第一个语音情感合成系统“effect editor”,首次尝试用基音频率,时长,音质和清晰度等声学参数的变化合成情感语音;美国加州大学则致力于情感语音信号的分析,合成以及识别。在语音情感识别领域,他们以呼叫中心的客服系统为背景,研究如生气愤怒的负面情绪和高兴中性的正面情绪之间的区别,他们将语音情感识别技术集成入语音对话系统中,帮助计算机以更智能,更自然,更有效地和人类进行交流。论文网
3 面临的问题
虽然近几年国内外对于因情感识别的研究正在升温,并取得了长足的进步,但总体上来说还处于初级阶段,还有大量的理论和技术问题有待深入和解决。比如情感的定义及不同情感的分类界定,情感语音数据库的采集,有效情感语音特征的寻找以及高效的情感识别算法的研究等。下面是最主要的几个问题。
现存的主要问题,一是,语音情感数据库是进行语音情感识别的基础,而目前没有一个多情感多语言的标准国际通用语音库可以研究。已有的语音情感识别的研究成果大都建立在一个较小的素材范围之上,用于研究的语音样本大多属于人工材料,而且以模拟语料居多,所以在未来几年的研究中,建立标准化的大型情感语音数据库将是研究者们努力的方向,也是务必解决的问题,只有解决了这个问题,有关情感语音的研究才能获得长足发展。二是,没有一个适用于计算机实现的情感计算并且符合人类情感规律的模型[7],虽然现在存在较多的情感识别模型,但是大多都是来源于模式识别,但模式识别和情感识别之间的联系不是很直接,所以某些模式识别的模型很难直接用于语音情感识别,建立情感模型首先考虑的应是遵循情感心理特征并且适合情感计算这一原则。三是,没有帮助情感计算研究者的计算机仿真平台和情感计算库[7]。语音情感信息处理技术和表情识别技术的不成熟是制约情感计算与和谐人机交互技术发展的瓶颈。最后,由于人与人交流时,信息的获得不仅仅是声音,更多的一部分在面部表情,身体动作,所以情感识别也应该朝着多模式的方向发展,经语音和其他信息结合起来进行情感判断。 语音情感识别国内外研究现状综述:http://www.youerw.com/yanjiu/lunwen_75386.html