►各个主成分之间互不相关,因此对指标变量的分析比较方便。
►主成分包含了原有指标变量的绝大多数信息。即主成分是对原始值表变量信息的综合反映。
以上这些特点就是主成分分析在处理各个领域问题时具有明显的优势。
3。主成分分析的模型简介
主成分分析的出发点是通过初始变量的少数几个线性组合来解释初始变量绝大多数信息,可以通过下面的数学模型来表示:
设涉及某一事物的研究指标为 个,分别用 , ,…, 来表示,这 个指标构成了 维随机向量 。
设随机向量 的均值为μ,协方差矩阵为∑。
再进行对 的线性变化,所形成的新的综合变量,用 表示。 、 、…、 分别称为原始变量的第一、第二、……、第 主成分。
其中,各综合变量在总方差中所占的比重依次递减。在研究中,我们一般只会选取了前几个方差最大的主成分,达到简化系统原有复杂结构、抓住问题本质的目的。通常取使得累积贡献率达到85%的主成分个数即可。
4。主成分分析的步骤
主成分分析有两个核心问题:一是如何构造出主成分;二是如何对主成分进行命名解释。主成分分析有下面6个基本步骤:
►根据所研究的问题选取初始分析变量更收集相应的数据;
►根据收集的初始变量的特征判断利用协方差阵求主成分还是利用相关阵求主成分;
►求解协方差阵或相关阵的特征根及相应标准特征向量;
►判断是否存在明显的多重共线性,若存在,则返回到第一步;
►得到主成分的表达式确定主成分的个数,选取相应的主成分;
►结合主成分对研究问题进行分析并深入研究。
确定待分析的初始变量是否适合于主成分分析
主成分分析方法是从选取的众多原始变量中来构造出少数几个具有代表意义的主成分,这包含了一个潜在的要求,即要求我们选取的初始变量之间要具有比较强的相关性。倘若假设选取的初始变量之间不存在较强的相关关系,那么我们也就无法从中得到能反映某些变量共同特性的若干个主成分来。因此,在主成分分析时,需要对初始变量作相关分析。
最简便的方法即是计算各个变量之间的相关系数,得出相关系数矩阵。一般认为,如果相关系数矩阵在进行统计检验中,当初始数据大部分相关系数都小于0。3,运用主成分分析不会取得很好的结果。 SPSS在主成分分析过程中提出了几种检验方法来判断变量是否适合于作主成分分析,本文主要选用的统计检验方法有KMO(Kaiser-Meyer-Olkin)检验和巴特利特球性检验(Bartlett Test of Sphericity)。来*自~优|尔^论:文+网www.youerw.com +QQ752018766*
5。基于主成分分析的浙江省人才储备的研究
5。1原始变量的选取
研究必须考虑到人才的储备是一个长期发展的过程,全面衡量浙江省人才储备的真实情况需包含众多方面,如人才发展的产出、人才发展的投入、人才的发展的质量以及人才发展的环境等各方面的因素。因此,为了运用主成分分析的方法来研究浙江省人才储备的情况。本文从以上四个方面一共选取了12个指标。其中,人才发展的产出方面包括星火计划项目立项数和专利授权量;人才发展投入方面包括高等学校数、高等学校科技活动机构数和科技活动经费支出总额;人才发展质量方面包括高等学校毕业生人数、各级学校在校学生占省人口、平均每万人口中大学生数;人才发展环境方面包括全省生产总值、城镇居民人均可支配收入、城镇单位在岗职工工资总额和常住人口数。通过数据查询后得到浙江省1993年至2013年这12项指标的数据 多元统计分析的浙江省人才储备研究主成分分析法的应用(4):http://www.youerw.com/shuxue/lunwen_85308.html