第四章 结论总结 22
4.1比较MATLAB和SPSS语言程序的优缺点 22
4.1.1MATLAB的特点 22
4.1.2SPSS的特点 23
4.2SPSS语言对比MATLAB语言的优点 23
4.3研究展望 24
致谢 25
参考文献 26
第一章 绪论
1.1课题的应用背景
复杂管理更需要系统化、规范化、简单化,这就要求管理者有一定的分类能力。鉴于现实系统的复杂性,合理性,将复杂的样本数据进行分类成为市场规范化的迫切需求。
一组物理对象或在多个类相似对象的抽象对象进行分类的过程被称为聚类[1]。由集群生成簇类似于同一集群中的对象,这是不同的数据对象的集合,并且在其它簇的对象。“集群东西,一群人”,在自然科学和社会科学,有很多分类的问题。聚类分析,也被称为一组分析,是用来研究(样品或指标)分类的统计分析。聚类(clustering)是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。它的目的是使得属于同一个簇的样本之间应该彼此相似,而不同簇的样本应该足够不相似。与分类规则不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。简单地说,分类(CategorizationorClassification)就是按照某种标准给对象贴标签(label),再根据标签来区分归类。简单地说,聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。区别是,分类是事先定义好类别,类别数不变。分类器需要由人工标注的分类训练语料训练得到,属于有指导学习范畴。聚类则没有事先预定的类别,类别数不确定,不需要人工标注和预先训练分类器,类别在聚类过程中自动生成,在数据挖掘中,这是一种很重要的方法。但经典的基于普通等价关系的聚类方法是硬划分,要求太高,所以下文主要讨论基于模糊集理论的模糊聚类分析方法。
1.2模糊理论基础
1.2.1模糊集
模糊集理论是将模糊逻辑理论用于集对分析,结合从两个集合的同一性、差异性和对立性三个方面来研究系统的不确定性[2]。在处理不确定性问题时较为客观,运算也较简单,所以模糊集对分析理论已经成功运用于人工职能、系统控制、管理决策等领域。
定义1设U为论域,则称由如下实值函数所确定的集合A为U上的模糊集合,而A为模糊集合A的隶属函数,Au称为元素u对于A的隶属度。
1.2.2模糊关系
模糊关系在模糊集合论中占有很重要的位置。所以在这节我们将讨论模糊关系的基础运算。
定义2 X,Y是论域,R:X•Y0,1,称为从X到Y的模糊关系[2]。一、模糊关系运算
定义3我们设R,R是U*V上的两个模糊关系,则他们之间的运算为
包含:xU,yV,R1R2,等价于R1x,yR2x,y; (1-2)
相等:xU,yV,R1R2,等价于R1x,yR2x,y;