主成分分析的实际应用浅探(3)_毕业论文

毕业论文移动版

毕业论文 > 数学论文 >

主成分分析的实际应用浅探(3)


1.3.2结构安排
本文的第一章简单介绍了主成分综合评价的意义、历史和研究现状,说明文章的结构安排。第二章主要介绍主成分分析法,包括主成分分析的基本思想和几何意义、主成分求解方法和对结果进行正确分析。第三章将会运用主成分分析进行综合评价,说明主成分分析在综合评价的作用。第四章会对主成分分析法的适用范围、优缺点作出总结。
2主成分分析
2.1基本概念和意义
主成分分析(rPincilComonntAnlsis,PcA)是研究如何将多指标问题转化为较少的综合指标的一种重要统计方法,它能将高维空间的问题转化到低维空间去处理,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。除此之外,主成分分析还简化了变量系统的统计数字特征,提供许多重要的系统信息。
2.2基本思想
主成分分析是一种降维技术,在指标间相关程度高的时候,能将原来较多的指标简化为少数几个新的综合指标的多元统计方法,得到几个新指标依据信息含量的大小依次排序为第一主成分,第二主成分等等。在数据相关度高的情况下,主成分分析得到的主成分与原始变量之间有一下关系:1、主成分保留了原始变量绝大多数信息;2、主成分的个数大大少于原始变量的数目;3、各个主成分之间互不相关;4、每个主成分都是原始变量的线性组合。
2.3主成分分析的数学模型
假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。
这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。
 
满足如下的条件:
 1、每个主成分的系数平方和为1。即 2、主成分之间相互独立,可令主成分间协方差为0。即
 
3、主成分的方差依次递减,意着主成分包含的信息量依次递减,即
F1、F2….Fp分别称为原变量的第一、第二….第p个主成分。在适用于主成分分析的情况下,提取的主成分数远少于原指标数。
2.4主成分分析的几何解释
为了方便,我们在二维空间中讨论主成分的几何意义:
设有n个样品,每个样品有两个观测变量x1和x2,在由变量x1和x2 所确定的二维平面中,n个样本点所散布的情况如椭圆状。由图可以看出这n个样本点无论是沿着x1 轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量x1 的方差和x2 的方差定量地表示。显然,如果只考虑x1和x2 中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。
如果我们将x1 轴和x2轴先平移,再同时按逆时针方向旋转q角度,得到新坐标轴F1和F2。F1和F2是两个新变量。 (责任编辑:qin)