最大似然分类(Maximum Likelihood Classification,简称 MLC) ,是一种基于贝叶斯准则的非线性分类方法,它的分类错误概率最小,且应用比较广泛,是比较成熟的一种分类方法[11]。最大似然分类法假定遥感影像的每个波段数据都呈正态分布。它的基本思想是地物类数据在空间内构成特定的点群,每一类的每一维数据在自己的数轴上都呈正态分布,该类的多维数据就会构成一个多维正态分布;每个类别的多维正态分布模型都有各自的分布特征,比如形状、密集或者分散的程度等。根据各类的已知数据,可以构造出每一类的多维正态分布模型,即各类中数据的概率分布函数。在此基础上,对于每一个像素,求它属于各个类别的概率,对应哪个类别的概率最大,就将它划分到哪个类别[11]。
2。2 现有的遥感影像分类的不足
基于ENVI的传统遥感影像分类方法较多的是处理线性数据,对非线性和高维数据处理起来较困难,而支持向量机分类法虽然可以轻松处理非线性数据、也可以使用高维空间数据,但支持向量机分类法存在参数选择的问题,它没有特别好的办法去选择分类参数,应用时最佳的分类参数很难找到;另外,当训练样本数量较少,而样本的维度较高时,即面对的是小样本问题时,得出的结果也不是很理想[12]。因此,在专业软件ENVI里还没有能高效、快速、精准地处理高维非线性结构数据的方法。
3 基于度量学习的遥感影像分类
3。1 度量学习存在的价值文献综述
随着社会的发展和科技的进步,人类进入了信息化的大数据时代。人们通过这些数据可以更加直观的感知到现实世界的客观事物。因此学会对这些数据进行分析和处理就变得至关重要。在计算机领域,绝大多数数据分析、处理的基本任务都是在数据间的距离和相似度的基础上来展开的,因此可以度量数据的度量学习就成为了机器学习和模式识别等应用领域的重要研究方向和任务,近年来获得了巨大发展。
在理论研究方面,对于一些识别、分类和聚类等机器学习任务,它们需要获得数据间的距离,例如传统的马氏距离、欧氏距离等。基于监督的线性距离度量学习可以学习带有标签的数据样本,构造出一个距离函数,然后通过计算距离函数来获得不同的数据间的距离或相似度,然后根据数据间距离的大小划分样本数据。因此,从理论上来说度量学习还可以等同于特征提取技术。而对于高维数据,为了避免出现“维数灾难”,就需要对维数进行维数约减,非监督的距离度量学习在对高维数据进行降维后不仅能保持高维数据本身的结构与关系,同时还能获得其低维本质,这样既去掉了冗余信息,利于下一步的分析与处理,还不会破坏高维数据本身的结构[8]。
在实际应用中,对于高维的图像数据,一方面,我们可以使用线性度量学习进行检索和分类识别,例如人脸图像识别、文本分类等;另一方面,对于有可视化要求的高维数据,可通过度量学习对其进行降维,经过降维后的可视化数据更容易被人们理解和处理,这种方法在数据挖掘和大数据的处理与分析中经常用到。在现实世界中,大多数客观事物的数据都是高维且非线性的,因此度量学习在解决机器学习和模式识别等实际问题中发挥了重要作用[7]。而对于分类、聚类与识别等机器学习、模式识别与数据挖掘等的基本任务都是在数据上的距离度量的基础之上展开的,因此距离度量学习在解决机器学习与计算机视觉领域中出现的实际问题上有着非常重要的研究与应用价值[8]。 ENVI+MATLAB度量学习的遥感影像分类实验(3):http://www.youerw.com/shuxue/lunwen_200689.html