摘 要:本文选取高兴、愤怒、惊奇、悲伤四个孤立的基本情感作为研究对象并对语音情感智能识别系统进行了建模与仿真。该模型由预处理、特征提取和模式识别三个部分组成。选取了时长、振幅、基频、共振峰相关参数和利用美尔倒谱系数(MFCC)模型提取的特征参数作为主要研究参数,采用了隐马尔科夫模型(HMM)与人工神经网络模型(ANN)相结合的方法作为系统语音情感识别的方法。经MATLAB仿真,该模型有效地提高了语音情感的识别率。 4639
关键词:语音情感识别;特征参数提取;MFCC;ANN
Modeling and Simulation of Speech Emotion Recognition
Abstract: Four basic isolated emotions such as happy, anger, surprise and sadness are selected as the subject investigated and the modeling and simulation are performed on the speech emotion recognition system. This model consists of three parts such as preprocessing, feature extraction and pattern recognition. The related features such as duration, amplitude, fundamental frequency and formant parameters are extracted and are combined with the parameters extracted by using the MFCC model, which are used for the main parameters. The method of HMM which is combined with ANN is used for the speech emotion recognition. We can draw the conclusion that the model can effectively improve the speech emotion recognition rate through the simulation of MATLAB.
Key Words: Speech emotion recognition; Feature extraction; MFCC; ANN
目 录
摘要 1
引言 1
1.语音情感的分类及情感语料库的建立 2
1.1语音情感的分类 2
1.2语音情感数据库的建立 5
2.情感语音的预处理与特征参数提取 6
2.1概述 6
2.2预处理 7
2.3语音情感特征的提取 13
3.语音情感识别模型 17
3.1HMM模型 17
3.2人工神经网络法 18
4.总结与展望 19
附录 21
附录1:语音情感数据库的语料库 21
附录2:程序 22
致谢 27
语音情感智能识别的建模与仿真
引言
语音,是人类交际的重要工具。语音中不仅包含了文字符号信息,而且还包含了人们的情绪情感信息。语音情感,即语言中所带有的情绪情感特征。人们往往能够根据说话人的语调、语速、声音强度等特征迅速准确地明白说话人的情绪。随着人机交互(human-computer Interaction)技术的发展,如何使计算机拥有人一样的语音情感辨别能力显得越来越重要。这种使计算机从人的语音中分析出所带有的情感类型的过程,即是语音情感智能识别。语音情感识别不仅促进了人机交互领域的重大发展,而且还促进了心理学,生理学,认知科学等的成熟和发展。语音情感智能识别具有广阔的应用前景如:对残疾人说话具有辅助作用;可以使人机界面更人性化;可与其它多媒体技术相结合等等。
语音情感智能识别技术已经取得长足的进步。1972年,Williams发现,人的语音的基音轮廓会随着人的情感不同而有很大的变化,大大促进了人们对于语音特征中基音轮廓的研究。1990年,有人提出了“情感编辑器”的概念,并利用情感编辑器对人的语音信号和脸部表情等分析采样,从而使语音情感的识别研究又前进了一步。2000年,日本产业技术综合研究所研制出了一个女性机器人,可以对主人的语音信号进行识别,进而做出喜、怒、哀、乐和惊讶的表情等等,这个研究即用到了语音情感智能识别的技术。 MATLAB语音情感智能识别的建模与仿真:http://www.youerw.com/zidonghua/lunwen_1386.html