(3)化学成分检测:选用合适的化学检测方法测量样品中的成分含量,测量时间要与光谱采集的时间相一致,避免时间变化对样品化学成分造成的影响。
(4)建立模型:采用合适的建模方法,对光谱数据进行预处理以及波长优选,建立高精确度的数学模型。
(5)预测模型的评价:通过相关系数、校正集均方根误差、预测集均方根误差等相关指标评价模型。
(6)未知样品的预测:符合评价指标的模型可用于未知样品相应化学成分的检测和分析。
1.3.5近红外光谱分析技术的应用
近红外光谱分析技术因其具有检测样品无需预处理,无损、绿色检测,分析时间短效率高,可在线检测等技术特点被应用于各个领域。
(1)农产品及食品领域:Norris等最先将近红外光谱分析技术应用于农产品领域,他们对谷物、水果、蔬菜中的水分、蛋白质等成分的检测进行研究。此后,近红外光谱广泛应用诸如葡萄[13]、梨[14]、脐橙[15]、鲜枣[16]等水果成分的检测分析,食用油[17]、肉类[18]、水产品等的品质分析及鉴别。
(2)生物医药领域:近年来近红外光谱技术被广泛应用于茯苓[19]、石斛[20]等中药材成分的检测及鉴别。由于该光谱技术样品检测无损、可实现在线分析等特点,也被用于人体血糖浓度[21]和脑氧量[22]的检测。
(3)其它领域的应用:由于近红外光谱技术快速便捷、绿色无污染、样品检测范围广等特点,也被用于土壤[23]、汽油[24]等物质的检测与鉴别。
1.4光谱数据处理及建模
1.4.1偏最小二乘法
偏最小二乘法(PartialLeastSquareMethod,PLS)是一种多自变量对多因变量的线性回归建模分析方法[25]。作为一种新型的数据多元统计分析建模方法,它的出现打破了认识性的方法和模型式的方法之间的界限,将两者有机的结合在一起。PLS是多元线性回归法的延伸,可以弥补主成分回归分析中遗漏相关性较小的有用信息的缺陷,减少多元线性回归分析对数据的约束性,成为最常用的回归建模方法。
1.4.2预处理方法
近红外光谱区主要出现的是含氢官能团的倍频及合频吸收光谱,由于在该区域内的光谱吸收强度较弱,信噪比以及灵敏度较低,倍频及合频形成的谱带极易发生重叠,所以基于近红外光谱技术采集的光谱数据除了含有所需的样品信息外,还携带许多无关信息。对光谱数据进行适当的预处理,可以消除某些物理因素和背景噪音的干扰,以便提取有用信息,更好地建立光谱与化学成分之间的相关性,提高预测模型的稳定性和可靠性。常用的光谱预处理方法有导数算法(1stDerivative)、标准正态变量变换(StandardNormalVariateTransformation,SNV)、均值中心化(MeanCenter)、标准化(Autoscale)等。
(1)导数算法导数算法在近红外光谱数据预处理中是最常用的方法,主要包括一阶导数
(1stDerivative)和二阶导数(2ndDerivative)[26]。一阶导数表示的是自变量的变化率,二阶导数是一阶导数的变化率,即自变量变化率的变化率。用导数算法对近红外光谱进行预处理后可以有效消除光谱仪器背景干扰以及基线漂移,提高谱图的分辨率。但导数算法在扣除背景和基线产生的干扰信号的同时,也会引入噪声,降低谱图的信噪比,因此在进行导数算法预处理时,要选择适当的差分宽度。
(2)标准正态变量变换标准正态变量变换(SNV)主要用来校正由于样品表面不光滑、固体颗粒大小不同及分布不均以及光程变化等引起的散射。SNV法与多元散射校正(MultiplicativeScatterCorrection,MSC)(对一组光谱数据进行分析)不同,是基于每条光谱中各波长点的吸收值应该符合正态分布的假设,对每一条光谱进行校正,其校正能力比MSC强[27]。(3)均值中心化和标准化均值中心化和标准化是主要的光谱数据增强算法。均值中心化是指将光谱中每个波长变量减去样品集的平均值;标准化是指将光谱中每个波长变量减去样品集的平均值,再除以样品的标准差。两种算法的目的都是使所有波长变量分布在零点两侧,增强样品数据之间的差异,处理后的光谱数据充分反映样品的变化信息,可以简化回归模型的建立[27]。 基于近红外光谱技术结合波长优选分析桑叶品质(6):http://www.youerw.com/shengwu/lunwen_203692.html