2.1主元分析的基本原理
主元分析方法是将高维的给定数据投影到低维的子空间中并在最大程度上保留原始数据的信息,其主要思想是将高维的较难计算的变量转化为低维的易于计算的变量,投影所得到的变量是原始给定变量的线性组合。且含有原始给定变量拥有的绝大部分有用信息,同时需要计算的数据变量的个数也在原基础上减少了,且新产生的数据变量之间不存在相关性。变化方向的主次顺序根据变量变化的方差大小来决定,按主次顺序将主元依顺序称为第一主元、第二主元、第三主元等,这些主元之间相互不关联的[21]。来!自~优尔论-文|网www.youerw.com
举例说明。设定一共有m组测量,且每组测量均含有两个变量 和 ,在二维平面上画出两个变量 和 的参数变化示意图,如图2-1,变量参数的数据点大致分布在图中椭圆内。
由图可知,坐标轴 和 的变化会对图中样本点间的差异程度有影响,将坐标轴 和 旋转 角度,得到旋转后的新坐标轴 和 ,且椭圆的短轴对应着 ,椭圆的长轴对应着 ,新旧坐标轴之间的关系为:
=
= (2-1)
由图可知,新坐标系中样本点的差异主要体现在 轴,若 轴体现的差异达到85%及以上,则可以将 轴忽略不计,此时只考虑一个变量,减少了系统的运算量,提高了分析效率。 称为第一主元, 即为第二主元。