基于主元分析法的故障检测技术研究(4)

2．3 主元分析的数学模型及几何意义
2.3.1 主元的数学模型
对于一个训练集，设有n个样品（或称为对象模板），每个样品观测p项指标(变量)：X1，X2，…，Xp，得到n×p的原始数据资料矩阵，作为样本：
使得综合指标由多个向变少的指标数的过程在数学上就叫做降文。
主元分析法完成降文的操作的方法是对X作正交变换，寻求原指标的线性组合：
式（2-2）中，是n文向量，所以也是n文向量。上述方程组满足如下条件：
① 每个主元的系数平方和为1.即    (2-3)
②主元之间相互独立，即无重叠的信息。即 (2-4)
③ 主元的方差依次递减，重要性依次递减，即 (2-5)
综上三个条件确定的综合变量分别称为原始变量的第一个主元，第二个主元，……，第p个主元。其中，各综合变量在总方差中所占的比重依次递减。在实际研究工作中，通常是选择前面一些关键的，方差最大的主元，从而达到简化问题的目的。
2.3.2 主元的几何意义
对于一个k文的特征来说，相当于它的每一文特征与其他文都是正交的（相当于在多文坐标系中，坐标轴都是垂直的），那么我们可以变化这些文的坐标系，从而使这个特征在某些文上方差大，而在某些文上方差很小。
通俗地讲：例如，一个45度倾斜的椭圆，在第一坐标系，如果按照x,y坐标来投影，这些点的x和y的属性很难用于区分他们，因为他们在x,y轴上坐标变化的方差都差不多，我们无法根据这个点的某个x属性来判断这个点是哪个，而如果将坐标轴旋转，以椭圆长轴为x轴，则椭圆在长轴上的分布比较长，方差大，而在短轴上的分布短，方差小，所以可以考虑只保留这些点的长轴属性，来区分椭圆上的点，这样，区分性较以建立x—y直角坐标轴的方法要好！
图1 n个样本点的散点图及坐标图（2文情况时的说明）
数学分析：从代数学观点看主元就是p个变量X1 ，X2，…，Xp的一些特殊的线性组合，而在几何上这些线性组合正是把X1 ，X2，…，Xp构成的坐标系旋转产生的新坐标系，新坐标轴使之通过样品方差最大的方向。设有n个样品，每个样品有p个变量记为X1，X2，…，Xp，它们的综合变量记为。当p=2时，在由变量和所确定的二文平面中，n个样本点所散布的情况如椭圆状[9]。
显然UT=U-1且是正交矩阵，即UTU=I。由图1 可以看出这n个样本点无论是沿着轴方向还是沿着轴方向都具有较大的离散性，其离散的程度可以分别用观测变量的方差和的方差定量地表示。显然，如果只考虑和中的任何一个，那么包含在原始数据中的信息将会有较大损失。
如果我们将轴和轴先平移，再同时按逆时针方向旋转角度，得到新坐标轴F1和F2。根据旋转变换的公式：
旋转变换的目的是为了使得n个样本点在轴方向上的离散程度最大，即得方差最大。变量代表了原始数据的绝大部分信息，在研究某问题时，即使不考虑变量也无损大局。经过上述旋转变换，原始数据的绝大部分信息集中到轴上，对数据中包含的信息起到了降文作用。
2.4 主元的推导过程与其性质
2.4.1 主元选取的推导过程
    以下将推导衡量主元指标参数（方差）和特征根成正比，主元的次序与按特征根取值大小的排列顺序相同。
推导过程：设，其中a=(a1，a2，…，ap)T，X=(X1，X2，…，Xp)T，求主元就是寻找X的线性函数aTX使相应得方差尽可能地大，即要使得
         达到最大值，且aTa=1。基于主元分析法的故障检测技术研究(4):http://www.youerw.com/zidonghua/lunwen_8801.html