1.2 本文的研究内容
本项目用新浪微博开放平台API的接口,提取大家共同关心的话题,包括最近小时,最近一天以及最近一周的热点话题,并存入本地数据库,进行相关分析。
由于新浪微博目前发展较为完善,并且提供了较为完善的API接口和相关的开发文档,使得从新浪微博获取当前的热点话题变得较为容易,所以本项目就选用新浪微博作为对象,主要实现的功能是对最近的热点搜索话题进行收集,并存入本地数据库,以备后面工作的需要。
1.3 本文结构
第一章 绪论。本章主要介绍了本论文的研究背景、目的及意义,主要介绍国内外微博的发展,以及对其中一些热点话题提取技术的意义及方式,从而进一步提出了本文的研究内容。
第二章 开发平台的介绍。本次开发采用的是易语言,本章首先是对易语言的基本介绍,包括易语言的优点和目前市场的使用及定位。然后是介绍易语言的安装。
第三章 需求分析。本章主要是介绍获取热门话题的相关需求,并对开放API进行相关的介绍以及新浪微博的API和APP KEY 的申请。获得APP KEY之后如何取得所需要的热门话题,包括了提取和解析JSON文本,以及编码的转换问题。
第四章 与本地数据库连接。本章主要介绍提取并解析完JSON文本后,将热点话题存入本地数据库的相关操作。包括了数据库的设计,数据的导入以及对于导入数据的筛选,分析,提取操作等。
第五章 程序结果以及分析。本章主要介绍了本次设计的测试环境和检测流程,测试中各种主要的数据的意义,主要代码实现的解释,测试结果的分析,还有可行的改进方法。
2 开发环境介绍
本次设计实验是在易语言的开发环境下完成的。易语言是一门新兴的计算机程序语言。以“易”著称,以中文作为程序代码表达的语言形式。易语言的创始人是吴涛。早期版本的名字为E语言。易语言最早的版本的发布可追溯至2000年9月11日。可以说,创造易语言的初衷是进行用中文来编写程序的实践。从2000年至今,易语言已经发展到一定的规模:功能上、用户数量上都十分可观。
其次还用到了ACCESS数据库。Access 是微软公司推出的基于Windows的桌面关系数据库管理系统(RDBMS,即Relational Database Management System),是Office系列应用软件之一。它提供了表、查询、窗体、报表、页、宏、模块7种用来建立数据库系统的对象;提供了多种向导、生成器、模板,把数据存储、数据查询、界面设计、报表生成等操作规范化;为建立功能完善的数据库管理系统提供了方便,也使得普通用户不必编写代码,就可以完成大部分数据管理的任务。
2.1 易语言和ACCESS数据库简介
易语言:
创建者:大连大有吴涛易语言软件开发有限公司(2004年前吴涛独立开发,2004年成立公司)
易语言简称:E、E语言
从2000年发展至今 学习人数已经超过4千万人
最新版本:易语言5.11版(静态编译)
易语言也有对应的英文版本,称作EPLSW,最新版本为4.01,对应中文版本的4.01,仅仅是语言和输入方式上存在不同。
特色:以简体中文作为程序代码进行编程操作。
★全中文支持,无需跨越英语门槛。
★全可视化编程,支持所见即所得程序界面设计和程序流程编码。
★中文语句快速录入。提供多种内嵌专用输入法,彻底解决中文语句输入速度慢的问题。
★代码即文档。自动规范强制代码格式转换,任何人编写的任何程序源代码格式均统一。 微博热点话题提取技术研究+文献综述(2):http://www.youerw.com/jisuanji/lunwen_3679.html