2。3本章小结
本章主要写了用户的需求分析和需求建模。主要写了用户需求,功能需求,性能需求,运行平台,从不同方面分析了需求。最后根据之前的需求,分析了系统的流程图,具体分为采集信息,处理信息,web可视化,和数据分析与预测等主要四个核心过程。文献综述
3总体设计
系统在大数据背景下,用大数据相关技术和web相关技术来实现本文描述的系统。大数据使用Storm平台处理,产生的数据流通过web可视化展示,实时展示数据的动态变化,来帮助大学生决策下一步的行为。
3。1设计目标
利用本科生期间所学到的软件工程的知识与相关编程技术,完成大数据平台分布式监控指标采集和分析系统的设计与实现。能够清晰完整的实现课题所要求的内容以及完成系统后续的测试,保证系统的稳定性,可靠性,安全性。系统能在实际环境下发挥系统的功能,为解决学生寻找自习位置的实际问题提供有效的帮助。
3。2基本技术方案
3。2。1Storm+Zookeeper框架
Storm一个分布式计算框架,是系统开发的核心平台,毕设的大数据处理基于Storm的实时处理平台,是处理大数据的工具之一,掌握这个平台对大数据的处理十分重要。Storm跟我们平时大数据处理使用的Hadoop平台是非常相似的,不同点在于Storm能处理实时任务,而Hadoop确不能,例如统计某些用户的交易量,生成为某些特定用户的推荐列表等实时性要求高的需求。在处理数据方面,Hadoop拥有一种叫做MapReduce技术的高性能并行数据处理服务,而Storm拥有Spout和Bolt,这两个类似于Hadoop的MapReduce技术。Storm计算框架下面包含Nimbus,Supervisor,UI等。Storm和Hadoop一样,一开始都收到很多公司的重视,很多实时任务不得不选择Storm,因为是唯一的选择,没有相关同类型的产品。而那些很早之前的就开始使用Storm的用户,反过来促进了Storm的推广和为Storm的发展,使得Storm在大数据处理中更具优势。来:自[优E尔L论W文W网www.youerw.com +QQ752018766-
下图是Storm的数据交互图:
图3。1Storm工作流程
Zookeeper是一个集中的服务维护配置信息,命名,提供分布式同步的应用程序协调服务。Zookeeper是Hadoop和Storm等系统的组件,这些类型的服务都必须使用某种形式的分布式应用程序。Zookeeper就是用来分装一些复杂的关键性任务,通过分装使得原本复杂的系统将稳定,高效的性能提供给用户,极大地简化了用户直接使用复杂系统容易导致的错误。