摘 要:随着互联网的普及和发展,越来越多的人们参与到电子商务这种新型的商业运营模式当中,而如何运用合理的统计方法对行业数据进行整理和分析,并依据数据处理后的结果对行业现状、行业发展趋势、同行业竞争度进行合理分析,同时制定出解决问题、优化策略的方案对电子商务来说显得尤为重要.38477
本课题以电子商务B2C的模式作为模型对过去近三个月时间里运营时产生的实时数据进行收集整理,用聚类分析方法对流量进行分类 ,再根据聚类分析结果分组建立回归模型,对未来的销售额进行预测. 毕业论文关键词:电子商务、流量分类、聚类分析、回归分析、数据处理、销售额预测
Abstract: With the popularization and development of the Internet, more and more people to participate in this new e-commerce business model which, and the use of sound statistical methods to the industry data collation and analysis as a basis for judging the status quo industry , industry trends, competition in the industry and other sectors of the relevant information, identify problems and to develop, plan, strategy optimization scheme is particularly important to solve practical problems in the future.
This topic B2C e-commerce model as a model for real-time data generated over the past three-month period were collected during operations, time as scalar data clustering analysis, regression model and then grouped according to cluster analysis, the future sales.
Keywords: e-commerce, traffic classification, cluster analysis, regression analysis, data processing, sales forecast
目录
一、问题的背景 6
1.1电子商务简介 6
1.1.1 电子商务的定义 6
1.1.2 电子商务的类型 6
1.1.3 电子商务运营流程 8
1.2 聚类分析 8
1.2.1 聚类分析的统计量 9
1.2.2 聚类分析的方法 10
1.3 回归分析 11
1.3.1 一元线性回归分析 11
1.3.2 多元线性回归分析 14
二、电商数据处理与数据统计 17
2.1电商相关的变量定义 17
2.2数据处理 18
2.2.1 数据清洗 20
2.2.2 数据筛选 22
2.2.3 数据整合 25
2.3 数据统计 27
2.3.1 描述性统计表及趋势图 27
2.3.2 根据描述性统计的变量分析 29
三、统计分析 30
3.1 聚类分析分类数据 30
3.1.1 系统聚类 30
3.1.2 聚类结果图 32
3.2 线性回归分析 33
3.2.1 一元线性回归模型 33
3.2.2 多元线性回归模型 39
四、预测模型 42
4.1 根据回归模型来预测销售额度 42
4.1.1一元线性回归模型的对销售额的预测 42
4.1.2多元回归模型的对销售额的预测 44
4.2 根据销售额度来规划未来趋势 45
五、模型评价 47
5.1 模型优点 47
5.2 模型不足 47
致谢 48
参考文献 49
一、问题的背景
1.1电子商务简介
电子商务是指以信息网络技术为手段,以商品交换为中心的商务活动.也可理解为在互联网(Internet)、企业内部网(Intranet)和增值网(VAN,Value Added Network)上以电子交易方式进行交易活动和相关服务的活动,是传统商业活动各环节的电子化、网络化.