MATLAB和PRAAT汉语普通话情感识别(4)

表2两种情感描述模型的比较

2.1.2 语音库原则及获取方法
语音情感是别的研究需要有大量数据作为基础，为此语音情感库便显得不可获缺。,标准的语音库可以为研究提供优质的数据，提供训练的基础。自语音识别技术得到重视的同时，国内外著名的科研机构便开始着手建立标准优质的语音情感库，并且现在已经具有一定的规模与标准。但是由于差异性的存在，得到大家一致认可的语音并不是太多。
语音情感库标准与否，直接关系到语音情感分析识别的好坏，是语音情感识别技术一个关键所在。这个语音情感库必须足够的自然，具有高度的真实性，才能让语音情感识别工作顺利的开展。不同的语言因为韵律等众多因素的不同需要不同的语音库，同时也需要遵守不同的规则，我们汉语语音库的建设过程中就需要注意很多问题，比如我们所选择的语句不能带有强烈的语义倾向性，这样会误导情感的判断；另外所选择的语音必须能够与所要求的情感很好的契合，要结合实际。我们通常用如下两种方法：录制法与剪辑法。前者需要不同性别不同年龄不同语言等等的人自己进行语音的录制，这样做的好处是语音库能够十分全面，有着不同特征的语音，但是缺点也很明显，并不能很好的保证自然度和其真实性；后者从各类媒体信息中剪辑出我们所需的语音材料，这种方法的优点是自然度和真实度高，并且有视频信息，缺点是寻找大量的语音材料需要很多时间，浪费人力，并且不全面。
常用的语音库有Belfast英语情感数据库，柏林EMO-DB德语情感语音库， FAU AIBO儿童德语情感语音库，CASIA汉语情感语料库，ACCorpus系列汉语情感数据库
本文所使用的语音库是CASIA汉语情感语料库：该语音库是中科院自动化研究中心通过科学的方法所收集的数据库，由2位男性2位女性在性噪比为35db的录音环境下，分别在生气、惊吓、高兴、悲哀、自然地情感状态下对500句文本进行的阅读采集得到，16kHz采样，16bit量化[15]。经过严格的筛选，最终保留其中9600句高质量语音。 MATLAB和PRAAT汉语普通话情感识别(4):http://www.youerw.com/tongxin/lunwen_19691.html