1。1 电子商务背景
电子商务系统的内涵主要包括以下三个方面,一是网络,计算机网络是电子商务的承载平台,所有的信息交互都基于网络实现,包括商品信息的发布、查询、浏览,支付过程的实现等;二是电子化,它改变了传统营销模式下以实物商品为主体的方式,将实体商品信息电子化以后,更加推动了电子商务的跨越式发展;三是以商务为中心,将各类技术、手段、模式等进行组合应用,最终的目标是提高商业效益。
1。2 大数据在电子商务中的应用
商务智能是对数据处理分析算法的应用,达到对商业过程进行分析的目的。目前已经出现了一些对电子商务数据进行处理和分析的系统平台,这些系统平台虽然最终应用目的不同,但是基本上包括了以下几个组成部分[1]:一是数据定义功能,即对待处理的数据格式进行定义;二是数据映射功能,将原始数据转换为符合定义的格式,三是环境配置功能,主要是配置各数据处理参数;四是调度功能,主要是根据应用目标,构建数据处理方案,最终得到处理的结果。当然这些数据处理平台还存在着一些不足,目前在电子商务领域的数据处理方面存在的主要问题包括:(1)电子商务数据分析的集成度低;(2)对于原始数据的预处理能力不强;(3)数据处理效率较低,可扩展性不佳。
目前国内著名的电子商务平台中,企业对数据分析平台的构建表现出了高度的热情,国内最大的电商平台淘宝,推出了量子数据和数据魔方,用以对海量的电商交易数据进行处理,谷歌公司推出了量子GA(Google Analytics)数据分析平台,该平台是一个第三方的数据分析平台,可以被不同平台上的电子商务应用,其研发的目标是为中小型的商务提供企业相关的电子商务[2]。数据分析也是一个体系工程,包括多个方面的内容,如对交易量数据的统计和分析等。电子商务平台的不断发展,积累了大量的用户数据,包括对于订单转化率的监控分析,对顾客的类型,以及忠诚度进行分析,甚至可以通过与相关领域知识的关联来分析,对行业的发展趋势进行研究[3]。电子商务数据分析的最终目标是提高投资回报率,每一家电子商务企业的最终目标是提高自身的投资回报率。对电商平台运营数据的充分利用则显得至关重要,所以数据挖掘在电子商务中的应用越来越广泛,主要包括:发现潜在用户;增加用户浏览时间;对电子商务网站的组织结构进行调整;预测市场的动向等等。
1。3 电商平台数据分析模型及分析算法
数据分析是基于电商平台的运营数据,所以清楚的理解电商平台的架构以及其特点对于数据分析而言至关重要。
a) socket通讯
业务层之间与服务层之间的数据采用socket通讯。Socket是面向客户/服务器模型而设计的,针对客户和服务器程序提供不同的Socket系统调用。客户端采用php,服务端采用java实现socket通讯。
b) 伺服程序
由于电商平台交易量巨大,产生的各种数据较为繁琐,所以有必要增加一个伺服程序,定时为数据进行预处理,如图1中的伺服程序。当服务器访问数据库时,即可快速查找到匹配的数据。这样对数据查询及响应速度会有很大的提升。论文网
c) 负载均衡
负载均衡是由多台服务器以对称的方式组成一个服务器集合[5],每台服务器都具有等价的地位,都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术,将外部发送来的请求均匀分配到对称结构中的某一台服务器上,而接收到请求的服务器独立地回应客户的请求。负载均衡能够将客户请求平均分配到服务器列阵,借此提供快速获取重要数据,解决大量并发访问服务问题。这种集群技术可以用最少的投入获得接近于大型主机的性能。