为了让网站信息组织结构做到“以用户为中心”,需要从海量的Web信息资源中将用户感兴趣的内容和信息准确、高效的挖掘出来,传统的数据挖掘技术已经无法满足这一需求,所以Web数据挖掘能够有效的解决这一问题。Web数据挖掘是在传统数据挖掘技术的基础上,结合Web资源的特点,从海量的数据中识别用户的兴趣特征、访问模式,预测用户的行为趋势,找出潜在的、有价值的隐藏知识。
现实生活中,Web日志挖掘有着很重要的作用,尤其是在电子商务领域的作用越来越大,其作用可归纳为以下三个方面。
(1)个性化的网站服务
不同的用户有不同的浏览习惯,他们在浏览一个页面之后,经常会浏览一些相关内容的网页,我们可以通过对浏览路径的挖掘,发现一些相关的逻辑页面,企业机关可以改善网站的设计结构,通过改变界面组织布局来满足用户需求,方便用户寻找相关信息,从而提高网站的吸引力。
(2)增强系统性能
可以通过分析用户的访问模式,浏览日志,可以了解到用户是否满意网站的服务,从而改进网站模式,提高网站的性能。
(3)商业决策
随着电子商务的迅猛发展,网上购物已经越来越普及,公司可以通过收集网络用户的浏览信息和购买数据,挖掘用户的购买偏好和消费特点,从而帮助企业制定新的营销方案,做出正确的决策。
1.2 国内外研究现状
1.3 论文的研究内容和组织结构
本文是在web日志挖掘和用户心智模型理论与方法的基础上,以中国制造网的用户访问日志作为研究数据源,采用基于k-means算法的用户聚类方式, 将用户聚类,为每个用户提供个性化推荐。
论文共分为5章,第一章介绍了研究的背景和国内外研究现状和方向。体现了Web数据挖掘的必要性。第二章介绍了从数据挖掘到Web挖掘到Web日志挖掘的相关含义,特点以及方法等,这也是本文研究所涉及的核心领域。第三章是对Web日志挖掘所涉及的聚类分析进行了介绍,阐述了聚类分析的相关概念,方法以及重点介绍了本文研究数据所需的K-mean聚类分析算法。第四章是对用户心智模型的简单介绍,表明了网站产品分类目录设计要以用户为中心。第五章是基于用户心智模型的网站产品目录个性化推荐应用研究,主要是用spss软件对Web日志进行聚类分类,实现根据将产品目录聚类,最终实现个性化推荐。
2 数据挖掘
2.1数据挖掘概述
数据挖掘,它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。从广义上说,数据挖掘是从存放在数据库,数据仓库,也可以是文件系统或者以其他信息库的数据中提炼出我们想要的内容。所以,数据挖掘有如下三个特点:
(1)数据挖掘的数据量巨大,挖掘的类型也是多元的。因此,需要我们高效的存取数据,采用高效的挖掘算法来保证数据挖掘的效率。同时,数据挖掘的类型也多种多样,他可以是数据库,数据仓库,也可以使其他形式的数据集合。
(2)数据挖掘的过程是复杂的。一个完整的挖掘过程需要经过需求分析、数据预处理、建造模型、评估成果、应用检验等步骤。这就要求我们有系统的理论知识基础,良好的分析能力。
(3)数据挖掘的目的是为了获取信息中隐含的,用户感兴趣的,潜在的信息。数据挖掘的结果最终是希望能够对实际业务产生作用,而不是生成无意义的数据结果或规律。 基于用户心智模型聚类网站产品目录的个性化推荐研究(2):http://www.youerw.com/jisuanji/lunwen_12862.html