我国各省不同行业平均工资水平分析(2)_毕业论文

毕业论文移动版

毕业论文 > 数学论文 >

我国各省不同行业平均工资水平分析(2)


之前也有相关研究表明居民收入还是基于传统行业,需要扩展现代信息服务业来增加居民工资.
所以本文通过多元统计分析方法对我国各地区不同行业城镇居民的工资平均水平现状进行分析.通过分析,找出我国各省不同行业城镇居民的工资平均水平特点及其中存在的不足.主要利用主成分分析、判别分析、聚类分析等多元统计分析的方法,对我国各地区不同行业城镇居民的工资平均水平的差异程度及不合理因素进行分析,并提出一些可行性建议,促进改善我国各地区不同行业城镇居民的工资平均水平的提高,提高我国居民生活质量.

2 多元统计的分析的理论
2.1 聚类分析
首先,将 个样品看成是 类(其中每一类包括了一个样品),然后再将性质最接近的两类合并为新的一类,这样就能得到 类,再从中找出最接近的两类合并起来,于是变成了 类,依照此方法一直进行下去,最后所有的样品会在一类中.将以上并类的过程画成一张图(称为聚类图),可以决定分为多少类,每类包含多少个样品.如下列步骤:
(1) 计算 个样品每两个之间的距离 ,记作 ;
(2) 构造 个类,每一类只包含一个样品;
(3) 把距离最近的两类合并为一新类;
(4) 计算其与当前各类的距离,如果类的个数为1,跳到步骤5,否则接着步骤3;
(5) 画出聚类图;
(6) 决定类和类的个数.
其图示如下:
 
图2-1 系统聚类法过程图
对数据相似性度量,可以用不同的距离公式,用 表示指标,用 和 表示第 个指标均值以及标准差,用 表示第 个样品和第 个样品之间距离则有,
                                             (2-1)
称为欧氏距离,
                                (2-2)
称为马氏距离。
2.2 判别分析
当我们遇到被解释变量是属性变量,解释变量是度量变量时,就比较适合用判别分析的分心方法.当然要求解释变量是可测量的,这样才能更方便的计算出平均值和方差.
分别有两个总体 和 , 是一个样品( 文),如能定义 到两个总体 和 的距离 和 ,则可用以下的规则判断:
            (2-3)
当 和 正态总体时,引进马氏距离的概念,则有:
 、 、 、 分别为 和 的均值和协方差阵,若总体不是正态总体,有的时候也可以用马氏距离描述 到总体的距离. (责任编辑:qin)