数据挖掘在电子商务中的应用(3)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

数据挖掘在电子商务中的应用(3)

也是因为数据挖掘能给企业带来显著的经济效益,各大电商企业越来越注重数据挖掘技术在策划运营中的应用。数据挖掘技术在电子商务中重要应用于潜在用户挖掘、用户分群、个性化商品推荐服务以及资源优化这几个方面。其中淘宝、京东等大型综合性电子商务网站是数据挖掘的主要应用企业,因为综合性零售网站可以积累了大量的交易数据,例如用户的历史交易记录、货物储备销售量、用户的消费与浏览记录等等都为数据挖掘提供了充分的数据资源。其中,由于企业规模的扩大和用户数量的激增,“淘宝网”也从简单的C2C网络集市转变成为囊括C2C、分销、拍卖、直供、众筹、定制等等多种电子商务模式的综合性零售商圈。大量零售数据的挖掘有助于建立用户群,运用用聚类技术,可以使企业更精准地挑选出高质量的潜在户;分析用户的浏览记录,挖掘顾客购买偏好,运用关联规则分析,可以更好的进行商品个性化推荐等等。

2。 数据挖掘技术概述

2。1。 数据挖掘的定义

数据挖掘是囊括了数据库、人工智能以及统计学等多个科学领域的一种处理大数据信息的方法。通过对历史积累的大量数据进行的有效挖掘,尝试从这些繁杂的数据中挖掘出先前未知但有利的知识。也就是说,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,分析出隐藏在数据中、人们难以发现却具有利用价值的信息和知识的一个过程。数据挖掘作为数据库知识挖掘中一部分,也可以定义为是从大量的数据中运用算法寻找其中隐藏的信息过程。其原理是利用算法对处理好的输入和输出数据进行训练并得到模型,进而对模型进行验证,使得模型在一定程度上刻画出数据由输入到输出的关系,然后再利用该模型对新输入的数据进行计算,从而得到新的输出,这个输出然后就可以用来解释应用了。

2。2。 数据挖掘的类型

2。2。1 分类 

分类是依据事物在数据表面体现的特征,对事物进行科学性的分类,它是数据挖掘技术中最多见的一种类型。常见的分类算法有决策树算法、神经网络算法、贝叶斯分类和支持向量机等等。其中,决策树算法被广泛应用于医学诊断和贷款风险评估;神经网络算法常用于语音识别、人脸识别。分类数据挖掘的过程可以描述为从已分类的数据集中训练得到一个模型,并且在这个数据集中使用数据挖掘分类技术建立分类模型,最后对未分类数据分类。文献综述

2。2。2 估计 

估计其实是一种与分类相似的数据挖掘类型。区别在于分类的类别是确定数目的,并且它的目标数据项是离散化的。与之相反,估计的估值量是不确定的,目标数据项是连续的。一般而言,估值可以辅助分类。在得到输入数据后使用估值,得出不确定连续变量的值,接着依据之前设定的阈值,实行分类。例如在企业汽车消费贷款业务中,运用估值,分别标记每个客户,再依据阈值,将贷款金额的级别实行分类。

(责任编辑:qin)