表2两种情感描述模型的比较
2.1.2 语音库原则及获取方法
语音情感是别的研究需要有大量数据作为基础,为此语音情感库便显得不可获缺。,标准的语音库可以为研究提供优质的数据,提供训练的基础。自语音识别技术得到重视的同时,国内外著名的科研机构便开始着手建立标准优质的语音情感库,并且现在已经具有一定的规模与标准。但是由于差异性的存在,得到大家一致认可的语音并不是太多。
语音情感库标准与否,直接关系到语音情感分析识别的好坏,是语音情感识别技术一个关键所在。这个语音情感库必须足够的自然,具有高度的真实性,才能让语音情感识别工作顺利的开展。不同的语言因为韵律等众多因素的不同需要不同的语音库,同时也需要遵守不同的规则,我们汉语语音库的建设过程中就需要注意很多问题,比如我们所选择的语句不能带有强烈的语义倾向性,这样会误导情感的判断;另外所选择的语音必须能够与所要求的情感很好的契合,要结合实际。我们通常用如下两种方法:录制法与剪辑法。前者需要不同性别不同年龄不同语言等等的人自己进行语音的录制,这样做的好处是语音库能够十分全面,有着不同特征的语音,但是缺点也很明显,并不能很好的保证自然度和其真实性;后者从各类媒体信息中剪辑出我们所需的语音材料,这种方法的优点是自然度和真实度高,并且有视频信息,缺点是寻找大量的语音材料需要很多时间,浪费人力,并且不全面。
常用的语音库有Belfast英语情感数据库,柏林EMO-DB德语情感语音库, FAU AIBO儿童德语情感语音库,CASIA汉语情感语料库,ACCorpus系列汉语情感数据库
本文所使用的语音库是CASIA汉语情感语料库:该语音库是中科院自动化研究中心通过科学的方法所收集的数据库,由2位男性2位女性在性噪比为35db的录音环境下,分别在生气、惊吓、高兴、悲哀、自然地情感状态下对500句文本进行的阅读采集得到,16kHz采样,16bit量化[15]。经过严格的筛选,最终保留其中9600句高质量语音。 MATLAB和PRAAT汉语普通话情感识别(4):http://www.youerw.com/tongxin/lunwen_19691.html