近年来的一些研究通过编码文本的情感极性来尝试学习弱化的情感词向量。Maas 在他的论文[8]中提出了一个概率主题模型,它可以利用句子中的每个词的词向量推断句子的情感极性。Labutov 和 Lipson使用logistic回归再次嵌入到词嵌入中,它把句子的情感监督作为正则化项。文献综述
2。2 文本情感分析
文本情感分析(也称为意见挖掘)是指用自然语言处理、文本挖掘以及计算机语言学等方法来提取和识别原素材中的主观信息的技术。
2。2。1 文本情感分析的研究领域
情感分析主要分为以下几类:情感极性分析(又称为倾向性分析),情感程度分析和主客观分析等。情感极性分析是指,给出一段文本,分析它的情感是褒义、贬义或者中性,情感程度分析则是在情感极性分析上进行更细的划分。例如,“很棒”和“还好”都是属于褒义情感,但是很明显的是它们的褒义程度是不同的,情感程度分析就需要区分出不同程度的情感。从个人理解来看,情感极性分析就是基于情感的三分类模型,情感程度分析就是基于情感的多分类模型。主客观分析则是指,给出一段文本,判断它是客观的(即不带感情色彩的)还是非客观的。
在文本情感分析领域最早做出贡献的就是Turney[9] 和 Pang[10],他们研究的是商品和电影的评论观点,此研究是基于文档级的两极情感极性分析。再后来,Pang[11]基于早先的两极情感极性分析,对电影评论进行了3至4星多类预测,即情感程度分析。Snyder[12] 还对餐馆的评分进行了更细化的分析,从不同角度如食物,气氛对餐馆进行5星的评级。
2。2。2 文本情感分析的主要方法
目前情感分析的方法主要分为两类:基于词典的方法和基于机器学习的方法。
(1)基于词典的情感分析
基于词典的方法是指,利用一个情感词典和制定一系列规则,对文本进行段落拆分、句法分析,计算情感值,最后利用情感值来判断文本的情感倾向。
(2)基于机器学习的情感分析
基于机器学习的情感分析,即是将对情感进行分类。最常见的就是利用机器学习判断情感极性,首先将文本转化为可以作为机器学习输入的格式,然后建立一个分类器,文本的正负向极性作为机器学习中的不同分类,训练出的模型就可以对文本的情感极性做出预测。
(3)基于词典和基于机器学习的情感分析比较
和基于词典的情感分析相比,基于机器学习的情感分析的特点是,它并不关心文本中具体包含哪些情感词,而是依赖于预料标注的类别是否准确。模型结果的好坏与语料库的规模和语料库的标注准确率有直接关系。
2。3 深度学习
深度学习是机器学习领域的一个方向,深度学习的概念最早由多伦多大学的Geoffrey Hinton 等人于2006年提出[13]。它其实是对多层人工神经网络的训练过程进行了改进,人工神经网络的出现最早可以追溯到1958年Rosenblatt提出的可以模拟人类感知能力的数学模型:感知器,因其结构过于简单且不能解决线性不可分问题,人工神经网络的发展长年处于低潮,直到1980年后反向传播算法被引入多层感知器,人工神经网络又开始成为研究热点,但是因为计算机计算能力的不足和训练数据的规模较小以及支持向量机等算法的兴起,导致人工神经网络自从2000年后再次陷入低潮,直到2006年Geoffrey等人对训练算法的改进,并提出深度学习的概念,从此,深度学习便火的一发不可收拾,目前,深度学习在语音识别与合成、机器翻译、大规模图像数据集、视频分类及行为识别等领域得到了广泛的应用。来:自[优.尔]论,文-网www.youerw.com +QQ752018766-