9
2。2。4 HDFS备份 10
2。3 Hadoop集群 10
第3章 需求分析及可行性分析 12
3。1需求分析 12
3。1。1 软硬件配置 12
3。1。2 系统需求分析 12
3。1。3 功能需求分析 12
3。2 可行性分析 13
3。2。1 技术可行性分析 13
3。2。2 经济可行性分析 13
3。2。3 社会可行性分析 13
第4章 系统设计 14
4。1 系统整体设计 14
4。1。1 MapReduce结构设计 14
4。1。2 HDFS结构设计 14
4。2 功能模块设计 15
4。2。1 系统读取文件设计 15
4。2。2 分析用户上网时间分布 16
4。2。3 网页访问量统计 16
4。2。4 输出结果功能 16
第5章 系统实现 17
5。1 相关软件安装 17
5。1。1 安装VMware Workstation 17
5。1。2 安装Eclipes 17
5。3 上网时间分析 18
5。4 网页访问统计 19
第6章 系统功能测试 21
结 论 23
致 谢 24
参 考 文 献 25
第1章 绪论
1。1研究背景
当前已进入信息化时代,随着信息化程度的不断提高,我们的生活也日趋丰富,但迅猛发展的表象背后是支持其发展的技术的不断提高和随之而产生的网络数据的不断增大。美国互联网数据中心有数据显示,互联网时代每年网络数据产生量递增约50%,两年基本翻倍。2015年7月中国互联网络信息中心在京发布的《中国35次中国互联网发展状况统计报告》指出,截止2015年6月,我国网民数量已达6。68亿,而互联网普及率也增长至48。8%。论文网
1。2 研究现状
1。3 研究意义
1。3。1 精细划分用户群组
帮助客户划分用户群体,能做到针对性吸引用户,且精准投放广告。以电商为例,在考虑客户需求时,不是店里有什么商品就卖什么商品,而且要研究用户需要什么商品而卖什么商品,并且要考虑买家愿意花费多大代价去购买此商品,这种环境下就需要将用户划分为不同群组,分别为其制定相应策略。而在投放广告时更是如此,将有限的资金投放到最能获取客源的地方,生意才能越做越好。
1。3。2 便于上网管理
对于大公司而言,规范员工上网是必不可少的,也是目前较难控制的。聊天、玩在线游戏、逛论坛、购物等造成工作效率低的行为以及音频、视频网站等大量占用网络带宽、影响他人正常工作的行为,都威胁这公司网络甚至公司正常运行的节奏。而网络用户行为分析就在公司和员工达成的协议基础上监察、限制用户上网,以期达到公司更好运营的目的。 Hadoop用户上网行为分析系统的设计与实现(2):http://www.youerw.com/jisuanji/lunwen_93884.html