因子分析的主要目的是降文,也就是在最少的信息损失的前提下,将多个原有变量综合成几个综合变量即因子,从而达到降文的目的。
2.2因子分析模型的建立
设有 个原有变量 , , ,……, ,它们之间存在较强的相关性,而且每个变量(经标准化处理后)的均值为0,标准差为1。现将每个原有变量分别用 ( < )个因子 , , ,……, 的线性组合来表示:
式(1)便是因子分析的数学模型,用矩阵的形式可以表示为:
(2)
式(2)中 称为因子, 称为因子载荷矩阵, ( ; )称为因子载荷系数,是第 个原有变量在第 个因子上的载荷,相当于回归模型中的回归系数; 称为特殊因子,表示原有变量无法被因子解释的部分,相当于回归模型中的残差;且满足 ( )之间不相关, ( )之间不相关, 与 相互独立。
2.3因子分析的基本步骤
2.3.1因子分析的前提条件
因子分析的关键是从众多原有变量中提取出少数几个公共因子,这就要求原有变量之间要有较强的相关关系,否则就无法从中综合出能够反映某些变量共同特性的几个较少的公共因子,因此,在进行因子分析时,首先要对原有变量是否相关进行分析。常用的方法有:
(1)计算相关系数矩阵 计算原有变量的简单相关系数矩阵并进行统计检验,如果相关系数矩阵中的大部分相关系数值都小于0.3,则不适合进行因子分析。
(2)Bartlett球度检验 以原有变量的相关系数矩阵为出发点,原假设为相关系数矩阵是单位阵,检验统计量是相关系数矩阵的行列式,如果该统计量的值较大,且对应的概率P值小于给定的显著性水平 ,则拒绝原假设,认为相关系数矩阵不太可能是单位阵,原有变量适合作因子分析。
(3)KMO检验 KMO检验统计量从比较变量间的简单相关系数和偏相关系数的相对大小出发,取值在0~1之间。当原有变量之间的偏相关系数的平方和远远小于简单相关系数的平方和时,KMO值接近1,KMO值越接近1,则变量间的相关性越强,原有变量越适合作因子分析。Kaiser给出了KMO度量标准:0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。
2.3.2因子提取
将原有变量综合成少数几个因子即因子的提取是因子分析的核心内容,而构建因子分析模型的关键是根据样本数据求解因子载荷矩阵。因子载荷矩阵的求解方法有很多,本文采用基于主成分模型的主成分分析法 全国不同省市城镇居民生活水平分析(3):http://www.youerw.com/shuxue/lunwen_10619.html