微博热点话题提取技术研究+文献综述(2)
时间:2017-03-02 22:45 来源:毕业论文 作者:毕业论文 点击:次
1.2 本文的研究内容 本项目用新浪微博开放平台API的接口,提取大家共同关心的话题,包括最近小时,最近一天以及最近一周的热点话题,并存入本地数据库,进行相关分析。 由于新浪微博目前发展较为完善,并且提供了较为完善的API接口和相关的开发文档,使得从新浪微博获取当前的热点话题变得较为容易,所以本项目就选用新浪微博作为对象,主要实现的功能是对最近的热点搜索话题进行收集,并存入本地数据库,以备后面工作的需要。 1.3 本文结构 第一章 绪论。本章主要介绍了本论文的研究背景、目的及意义,主要介绍国内外微博的发展,以及对其中一些热点话题提取技术的意义及方式,从而进一步提出了本文的研究内容。 第二章 开发平台的介绍。本次开发采用的是易语言,本章首先是对易语言的基本介绍,包括易语言的优点和目前市场的使用及定位。然后是介绍易语言的安装。 第三章 需求分析。本章主要是介绍获取热门话题的相关需求,并对开放API进行相关的介绍以及新浪微博的API和APP KEY 的申请。获得APP KEY之后如何取得所需要的热门话题,包括了提取和解析JSON文本,以及编码的转换问题。 第四章 与本地数据库连接。本章主要介绍提取并解析完JSON文本后,将热点话题存入本地数据库的相关操作。包括了数据库的设计,数据的导入以及对于导入数据的筛选,分析,提取操作等。 第五章 程序结果以及分析。本章主要介绍了本次设计的测试环境和检测流程,测试中各种主要的数据的意义,主要代码实现的解释,测试结果的分析,还有可行的改进方法。 2 开发环境介绍 本次设计实验是在易语言的开发环境下完成的。易语言是一门新兴的计算机程序语言。以“易”著称,以中文作为程序代码表达的语言形式。易语言的创始人是吴涛。早期版本的名字为E语言。易语言最早的版本的发布可追溯至2000年9月11日。可以说,创造易语言的初衷是进行用中文来编写程序的实践。从2000年至今,易语言已经发展到一定的规模:功能上、用户数量上都十分可观。 其次还用到了ACCESS数据库。Access 是微软公司推出的基于Windows的桌面关系数据库管理系统(RDBMS,即Relational Database Management System),是Office系列应用软件之一。它提供了表、查询、窗体、报表、页、宏、模块7种用来建立数据库系统的对象;提供了多种向导、生成器、模板,把数据存储、数据查询、界面设计、报表生成等操作规范化;为建立功能完善的数据库管理系统提供了方便,也使得普通用户不必编写代码,就可以完成大部分数据管理的任务。 2.1 易语言和ACCESS数据库简介 易语言: 创建者:大连大有吴涛易语言软件开发有限公司(2004年前吴涛独立开发,2004年成立公司) 易语言简称:E、E语言 从2000年发展至今 学习人数已经超过4千万人 最新版本:易语言5.11版(静态编译) 易语言也有对应的英文版本,称作EPLSW,最新版本为4.01,对应中文版本的4.01,仅仅是语言和输入方式上存在不同。 特色:以简体中文作为程序代码进行编程操作。 ★全中文支持,无需跨越英语门槛。 ★全可视化编程,支持所见即所得程序界面设计和程序流程编码。 ★中文语句快速录入。提供多种内嵌专用输入法,彻底解决中文语句输入速度慢的问题。 ★代码即文档。自动规范强制代码格式转换,任何人编写的任何程序源代码格式均统一。 (责任编辑:qin) |