(3)个人管理
第 2 页 本科毕业设计说明书
基于个人微博的情绪分析可以让人们加强对自我的了解,了解自己的情绪状态,从而调 整自己的情绪状态,提高生理健康,改善自己的人际关系。企业对员工微博进行情绪分析, 有利于了解员工的情绪状态,以及员工性格,从而更好地为员工分配工作,提高他们的工作 效率。
1。3 情绪分类研究现状
1。4 主要研究内容和组织结构
微博语料长度短小,数量多,且具有不规范性。它的文法通常是非正式的,语言偏口语 化和生活化,带有缩写、拼写错误、不规范用语、噪音及表情符。微博短文中通常含有显著 的个人意图和明显的个人zhuyi感情色彩。
本科毕业设计说明书 第 3 页
本文主要研究对新浪微博文本进行情绪分类,对于某条微博,首先判断它是否有情绪, 对于有情绪的微博进一步进行具体情绪预测,分为高兴 happiness、喜好 like、惊讶 surprise、 愤怒 anger、厌恶 disgust、恐惧 fear、悲伤 sadness 这七种情绪类别中的一种。文献综述
本文第二章构建了表情词典、卡方词典,实现了基于规则的情绪分类方法。第三章介绍 了 SVM、Naive Bayesian 联合 SVM、Naive Bayesian 联合 KNN、Naive Bayesian 联合 MLKNN 这四种基于机器学习的情绪分类方法。第四章,介绍了一种规则方法联合机器学习进行情绪 分类的方法。
第 4 页 本科毕业设计说明书
2 基于规则的情绪分类
基于规则的情绪分类方法主要依赖于情感词, 如“兴高采烈”、“惶然不安”。本章根 据微博的特点构建了表情词典和卡方词典,并制定了规则进行情绪分类,最后通过实验验证 了本章方法的有效性。
2。1 情绪词典 DUTIR
大连理工大学开发的情绪本体库 DUTIR 是 NLP&CC2013 指定使用的情绪词表,它是大 连理工大学信息检索研究室整理和标注的。
中文情感词汇本体中的情绪分为 7 个大类 21 个小类,其中 7 大类为好(like)、乐(happiness)、 哀(sadness)、怒(anger)、惧(fear)、恶(disgust)、惊(surprise),21 小类为快乐(PA)、安心(PE)、 尊敬(PD)、赞扬(PH)、相信(PG)、喜爱(PB)、祝愿(PK)、愤怒(NA)、悲伤(NB)、失望(NJ)、疚 (NH)、思(PF)、慌(NI)、恐惧(NC)、羞(NG)、烦闷(NE)、憎恶(ND)、贬责(NN)、妒忌(NK)、 怀疑(NL)、惊奇(PC)。它以 excel 的形式进行存储,情感词共 27466 个,详细存储形式见表 2。1。
表 2。1 DUTIR 情绪词典部分词
词 词性 词义数 词义序号 主要情感 强度 极性 辅助情感 强度 极性
贼眼 noun 1 1 NN 5 2 NC 5 2
战祸 noun 1