1.3 本文工作
本文基于偏最小二乘算法,以及与之相关的潜隐变量个数的选择方法。对流程工业检测的建模过程,通过把偏最小二乘算法引入到过程检测中,提出基于偏最小二乘的过程监控算法。最后,在TE过程的应用进行研究,以验证所提出方法的有效性。
2 基本方法介绍
2.1引言
过程工业中对于多变量统计性能监控的方法有很多,常常采用的有主元分析法(PCA)、独立元分析法(ICA)、费舍尔判别分析法(FDA)、规范变量分析法(CVA)、偏最小二乘法(PLS)。但是基于传统主元分析、独立元分析的过程检测方法没有考虑过程的质量波动及异常,而基于偏最小二乘的方法可以解决这一问题。
2.2 主元分析法(PCA)
主元分析(Principal Component Analysis,PCA)是解决多变量问题的简便有效的统计方法,其目标是在力保数据信息丢失最少的情况下,对高文变量空间进行降文处理。主元分析法的基本思路是:寻找一组新变量来代替原变量,新变量是原变量的线性组合。[5]
主元分析法是一种根据已获取数据的方差而进行的最优降文表示,通过奇异值求解方法来求取特征值和特征向量。保留特征值较大的那部分主成分变量,舍弃那些含少量信息的主成分变量,从而用数量较小的新的综合变量代替数量较多的原始多文变量。从优化的角度看,新变量的个数要比原变量少,并且最大限度地携带原变量的有用信息,且新变量之间互不相关。在实际的故障诊断中,一旦过程的实时测量数据与建立的主元模型不符,就可以判定过程中已有故障发生,再通过对测量数据中各个变量的贡献率进行分析,从而实现故障分离。
大部分多元统计过程控制要求过程数据服从独立同分布和多元正态分布,这两个条件一般在大多数工业过程中都得不到满足,因此在进行多元统计过程控制时一般都要对过程数据进行预处理以提高过程数据的正态性,但这样的处理还是不可避免地使得过程监控存在着一定的漏报率和误报率。并且PCA并不是十分适合于故障诊断,这是因为PCA在确定更低文的表达式时没有考虑到类之间的信息,仅仅根据正常工况或某一故障条件下的数据来建立模型。[6]
主元分析法的数据压缩过程实质上是对矩阵X的协方差矩阵进行谱分解过程。主元分析处理的是二文数据表,其主要特点就是在保证获取最大信息的同时对高文数据降文,设原始数据表为X(m×n),m代表样本个数,n代表变量个数,数据压缩的过程就是对X矩阵的协方差进行分解。首先对X进行标准化。
式中:E(xk)为第k个子数据空间的均值,Var(xk)是第k个子数据空间数据矩阵的方差。这样数据表的每个变量都具有了同等的表现力,通过数据中心化和压缩处理,数据表X就变成了均值是0方差是l的标准数据表。数据压缩的过程就是对X矩阵的协方差进行分解。
其中cov(x)是X的协方筹矩阵;pi是协方差矩阵的特征向量;λi是按降序排列的特征值。主元空问的信息提取实质上就是抽取最少的有代表性的少数主元个数,解释X矩阵中信息的变化,公式进一步可表示为:
(2-4)
其中:ti是系统主元,也称得分向量,提取采样数据问关联信息;pi是主元特征向量,也称载荷向量,提取变量间关联信息;E是残差矩阵,提取随机噪声和模型误差信息。各个得分向量之间是正交的,即对任何i和j,当i≠J时满足 ,各个负荷向量之间也是互相正交的,同时每个负荷向量的长度都是1,即 偏最小二乘算法在过程监控中的应用研究(3):http://www.youerw.com/zidonghua/lunwen_3154.html