3.2 数据资料收集与整理

    笔者通过百度、谷歌等搜索引擎,输入“驴友旅游安全”关键字,不断收集新闻游记约96篇。

为了保证样本的真实性和研究的规范性,剔除旅游商家发布的文章,选取真实的新闻文章,剔除照片或视频,然后对此进行合并。笔者将筛选出的文章进行文本转换,以便与特征词的提取。然后剔除了所有的数字、标点符号、段落符号、英文缩写等,剔除与中文词频分析无关的因素;接着将全部处理好的文本保存到文本文章中,用ROST CM6软件进行内容分析【6】。

3.3 高频特征词提取

    首先要建立一个自定义词表,接着导入待分析的文本,使用ROST CM6软件的分词功能,将所有文本进行处理,将语句分解成独立的词语。为提高文本分析的精确性,必须对文本进行分词处理后的结果进行检查,修正那些分词不正确,甚至错误的词。在此基础上利用软件“分词过滤词表”再建立一个过滤词表,过滤掉与本研究内容无关的词汇,使用“词频分析”功能生成词汇频数表。

上一篇:泰州市中南部美食旅游资源现状及开发对策
下一篇:旅游法背景下的旅行社经营分析

长江三峡游船旅游的自救”之路【2686字】

消费主义视角下的烧高香...

校企合作培养双師型”高...

探析刘邦故里”汉文化旅...

應用型本科院校旅游管理...

山东旅游产业融入一带一...

少数民族社区旅游资源利...

新課改下小學语文洧效阅...

网络语言“XX体”研究

麦秸秆还田和沼液灌溉对...

ASP.net+sqlserver企业设备管理系统设计与开发

互联网教育”变革路径研究进展【7972字】

老年2型糖尿病患者运动疗...

张洁小说《无字》中的女性意识

安康汉江网讯

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析