第三章介绍了情感文本分类特殊处理—否定转移。
第四章给出了程序的设计和运行流程图与实验安排。
第五章给出实验结果,分析实验结果并给出结论。
2 观点文本分类基础知识
2.1 引言
观点文本分类是文本分类的一种,是对文本极性极性分类的方法,分为正面(positive)和负面(negative)。在这一章节中,我们将详细介绍情感分类中的基础知识和各种分类方法,其中有文本的向量表示模型如何表示,文本的特征如何提取,都有哪些可用的分类器,以及分类特征的加权模型。我们先要介绍2种常用的分类方法,一种是机器学习的方法,另一种是情感词典的方法。然后我们重点介绍了基于机器学习方法中的特征提取和加权方法,以及常用分类器简介。
2.2 相关研究工作源]自{优尔·~论\文}网·www.youerw.com/
观点文本分类问题可以被看作是一类特殊的文本分类任务,它是从文本的情感倾向出发,将文本分成正面的评论和负面的评论。这和传统的主题分类相似又有所不同。传统的主题分类中,主题词的最重要的特征,而在情感分类中,情感词无疑是最重要的特征。
2.2.1 传统文本分类的研究概览
近年来,随着互联网的快速增长以及用户生成文本的产生,大量网络文本铺天盖地而来。这些海量的非结构化的文本中显然含有了大量的有用的信息。如何在这种海量的信息里找出自己想要的信息,就是文本分类。主题分类就是一种比较早期的分类,它根据文本的主题不同,将文本自动的分成多类,如军事、生活、科学及医学等。