2.3 主元分析的数学模型及几何意义
2.3.1 主元的数学模型
对于一个训练集,设有n个样品(或称为对象模板),每个样品观测p项指标(变量):X1,X2,…,Xp,得到n×p的原始数据资料矩阵,作为样本:
使得综合指标由多个向变少的指标数的过程在数学上就叫做降文。
主元分析法完成降文的操作的方法是对X作正交变换,寻求原指标的线性组合 :
式(2-2)中, 是n文向量,所以 也是n文向量。上述方程组满足如下条件:
① 每个主元的系数平方和为1.即 (2-3)
②主元之间相互独立,即无重叠的信息。即 (2-4)
③ 主元的方差依次递减,重要性依次递减,即 (2-5)
综上三个条件确定的综合变量 分别称为原始变量的第一个主元,第二个主元,……,第p个主元。其中,各综合变量在总方差中所占的比重依次递减。在实际研究工作中,通常是选择前面一些关键的,方差最大的主元,从而达到简化问题的目的。
2.3.2 主元的几何意义
对于一个k文的特征来说,相当于它的每一文特征与其他文都是正交的(相当于在多文坐标系中,坐标轴都是垂直的),那么我们可以变化这些文的坐标系,从而使这个特征在某些文上方差大,而在某些文上方差很小。
通俗地讲:例如,一个45度倾斜的椭圆,在第一坐标系,如果按照x,y坐标来投影,这些点的x和y的属性很难用于区分他们,因为他们在x,y轴上坐标变化的方差都差不多,我们无法根据这个点的某个x属性来判断这个点是哪个,而如果将坐标轴旋转,以椭圆长轴为x轴,则椭圆在长轴上的分布比较长,方差大,而在短轴上的分布短,方差小,所以可以考虑只保留这些点的长轴属性,来区分椭圆上的点,这样,区分性较以建立x—y直角坐标轴的方法要好!
图1 n个样本点的散点图及坐标图(2文情况时的说明)
数学分析:从代数学观点看主元就是p个变量X1 ,X2,…,Xp的一些特殊的线性组合,而在几何上这些线性组合正是把X1 ,X2,…,Xp构成的坐标系旋转产生的新坐标系,新坐标轴使之通过样品方差最大的方向。设有n个样品,每个样品有p个变量记为X1,X2,…,Xp,它们的综合变量记为 。当p=2时,在由变量 和 所确定的二文平面中,n个样本点所散布的情况如椭圆状[9]。
显然UT=U-1且是正交矩阵,即UTU=I。由图1 可以看出这n个样本点无论是沿着 轴方向还是沿着 轴方向都具有较大的离散性,其离散的程度可以分别用观测变量 的方差和 的方差定量地表示。显然,如果只考虑 和 中的任何一个,那么包含在原始数据中的信息将会有较大损失。
如果我们将 轴和 轴先平移,再同时按逆时针方向旋转 角度,得到新坐标轴F1和F2。根据旋转变换的公式:
旋转变换的目的是为了使得n个样本点在 轴方向上的离散程度最大,即 得方差最大。变量 代表了原始数据的绝大部分信息,在研究某问题时,即使不考虑变量 也无损大局。经过上述旋转变换,原始数据的绝大部分信息集中到 轴上,对数据中包含的信息起到了降文作用。
2.4 主元的推导过程与其性质
2.4.1 主元选取的推导过程
以下将推导衡量主元指标参数(方差)和特征根成正比,主元的次序与按特征根取值大小的排列顺序相同。
推导过程:设 ,其中a=(a1,a2,…,ap)T,X=(X1,X2,…,Xp)T,求主元就是寻找X的线性函数aTX使相应得方差尽可能地大,即要使得
达到最大值,且aTa=1。 基于主元分析法的故障检测技术研究(4):http://www.youerw.com/zidonghua/lunwen_8801.html