图1。1 基础电商平台架构
数据分析算法在大数据的发展中尤为重要,采取适当的算法对数据进行分析,可以在冗余的数据中筛选有价值的信息。以下是几种常见的数据分析算法。
a) 分类:分类是查找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到给定的类别中。可以应用分类、趋势预测等方法,如淘宝商铺将用户在一段时间内的购买情况划分成不同的类,根据情况向用户推荐关联类的商品,从而增加商铺的销售量。
b) 回归分析:回归分析反映了数据库中数据属性值的特性,通过函数表达数据映射的关系来发现属性值之间的依赖关系。它可以应用到对数据序列的预测及相关关系的研究中。在市场营销中,回归分析可以被应用到各个方面。如通过对本季度销售的回归分析,对下一季度的市场趋势进行预测并做出针对性的营销策略[4]。
c) 聚类:类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别。属于同一类别的数据间的相似性很大,但不同类别之间数据的相似性很小,跨类的数据关联性很低。
d) 关联规则: 关联规则是隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现。关联规则的挖掘过程主要包括两个阶段:第一阶段为从海量原始数据中找出所有的高频项目组;第二阶段为从这些高频项目组产生关联规则。关联规则挖掘技术已经被广泛应用于金融企业中用以预测客户的需求,例如:各银行在自己的ATM 机上通过捆绑客户可能感兴趣的信息供用户了解并获取相应信息来改善自身的营销。
1。4 研究内容
电子商务网站运营的过程中积累了大量的数据,对这些数据的分析可以发现潜在用户,对电子商务网站的组织结构进行调整,预测市场的动向,提高投资回报率等。
本文的主要研究内容如下:
(1)阐述了大数据在电商平台应用中的前景,而且对大数据进行分析也是当今电商平台发展的一个必然趋势。
(2)研究并分析了当今主流电商平台架构的特点,并介绍了其优缺点。介绍了本课题所涉及到的电商平台的架构。
(3)对运营数据进行统计分析,研究数据分析相关的算法,将其应用于本课题中,对结果进行可视化,管理员可直观的看到电商平台的业务数据及系统性能。\
1。5 组织结构
本论文是以电子商务平台为基础,对平台中的运营数据进行统计分析,并将分析的数据结果进行可视化处理展示给管理员。
第一章,绪论。介绍了本文的应用背景,研究目的与意义,论文的研究内容,并对本文的组织结构进行了综合描述。
第二章,电商平台部署及搭建开发环境。本章主要介绍了本课题所采用的电商平台的架构及开发环境的搭建过程, 并介绍所涉及到的开发工具。描述了JAVA+PHP开发架构的优缺点,后端JAVA工程的配置,前端PHP工程的部署,导入数据库的过程。运行基于windows应用的后端调试工具,验证开发环境是否搭建成功。
第三章,电商平台数据分析及可视化。本章主要介绍了电商平台的数据模型,以及如何对运营数据进行统计和分析,如何设计伺服程序对冗余的数据进行预处理,并利用ArmCharts图像库对数据结果进行可视化处理。文献综述
第四章,系统运行与测试。本章主要对数据统计分析并将结果可视化的这一过程进行测试,检测在大数据量情况下的运行效果,并根据测试结果来优化数据的查询策略。