1)    建立数据集
得到收集文本数据后,中文文本相对于英文文本有很大的区别,因此在进行分类前,首先应该针对中文文本进行分词、去停用词等。并且将数据人工分为测试集和训练集。
2)    建立文本表示模型
文本分类基于文本的特征所趋向的领域。文本特征是指能够突出地代表待分类文本的主要内容,为了降低文本分类的处理数据复杂度,有必要提取出文本内容的特征项进行代表文本内容,从而能够提高文本分类处理方法的性能和精度。
通过数学模型实现机器对文本的特征提取。不同的数学模型,所提取特征的效果不同。现阶段文本表示模型主要有两种:空间向量模型和布尔模型
上一篇:网络视频90后大学生受众收视调查与分析
下一篇:用电影剖析都市人杨德昌电影研究

网络环境下恶搞”电影的...

网络时代背景下的电视与...

微电影网络时代视觉文化...

好莱坞游戏型动画电影分类研究【3993字】

网络小说改编的影视作品...

电影产业网络研究综述【7857字】

电影产业化时代的网络影...

10万元能开儿童乐园吗,我...

承德市事业单位档案管理...

神经外科重症监护病房患...

志愿者活动的调查问卷表

中国学术生态细节考察《...

医院财务风险因素分析及管理措施【2367字】

公寓空调设计任务书

C#学校科研管理系统的设计

AT89C52单片机的超声波测距...

国内外图像分割技术研究现状