1。2 聚类分析的国内外研究现状
1939年,美国心理学家R。C。Tryon第一次创造了聚类分析方法来研究心理学,运用聚类分析的思想方法从相关矩阵中得到互相关联的组,由此聚类分析学科被正式提出。聚类分析,一种以没有先验知识为前提的无人监督模式的学习方法,主要是为了研究解决找寻未知分类数据的分类问题,它是按照数据之间的相似性来处理计算数据的分类,让同一类中的数据尽最大可能地相似,而类与类之间则尽可能相异。聚类分析已经在多个范畴中被研究多年,在这个过程中,人们愈发地体会到聚类分析的重要性,其主要集中在基于距离的聚类分析。聚类分析的主要研究对象是聚类算法,人们一直致力于研究聚类算法,而且提出了大量的聚类算法。因为聚类问题是一个病态问题,迄今为止发布的算法(包含上图1-1的算法)都只可以解决一部分的的聚类问题。如果遇到问题对象的改变,大多数算法就不满足条件或者解决能力很差。所有算法在算法计算效率、初始敏感性、高维性、可解释性、处理不同类型属性的能力、发现不同形状的簇、输入参数数目最小化等多方面存在或多或少的问题。文献综述
1。3 研究工具—R语言
R语言,作为S语言的一种实现,是一个开放的统计编程环境。R语言是一种软件,能够进行完整的数据处理、计算和制作图表。它的主要功能包括:对存储数据进行处理,对数组的运算,可以进行连续完整的统计分析,可以制作出色的统计图表,拥有简明强有力编程语言,可以对数据的输入和输出进行操作,可以实现分支及循环,用户可以按照自身需求进行自定义。
相对于其他应用软件来说,R是完全不收取任何费用的。并且可以在多种常用的操作系统上运行,并且拥有一个十分有用的帮助软件,拥有很强大的制作图表的功能。如果说R语言是一种统计软件,那么更可以把R语言作为一种数学计算环境,原因在于R供给了灵活互动的环境,我们可以对数据进行可视、剖析以及展现,用户可以通过R语言自身带有的统计程序包和一些集成统计工具及数理统计函数,按情况而定模型,当我们进行数据剖析等工作的时候我们需要通过相关联的数据库和参数。R软件可以使数据分析的过程变得简单明了,提供了简单的工具方法让我们能够简便快速地进行存储数据、分析计算的最终结果并且将其与之共享,让我们能够进行有效的决策。来`自+优-尔^论:文,网www.youerw.com +QQ752018766-
第二章 聚类分析
2。1 聚类分析的基本概念及定义
聚类分析的研究目的就是发现一系列对象、点、或者模式的自然的分组情况。Webster将“聚类分析”定义为关于通过定量对比多方面特征发现群体中的样本个体是不是属于不相同的类别的一种统计分类方法。
聚类的公式化描述:数据集中包括个簇,簇数量可能是原先已知的,也可能是我们要在聚类过程中确定的,个簇必须符合一下3个条件
聚类分析的R语言实现及应用(3):http://www.youerw.com/shuxue/lunwen_90377.html