2。3 常用机器学习算法
提取到目标物体的各类特征之后,就需要对这些特征进行分类,使得计算机能够知道 哪些特征是需要的,这就是一个机器学习的过程。有关数字图像处理的技术一般来讲都具 有较大的计算量,因此合适的学习算法的选择也是很关键的一步,这里主要介绍下 Adaboost 算法和 SVM(支持向量机)。
Adaboost 是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类 器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身 是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上 次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类 器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用 adaboost 分类器可以排除一些不必要的训练数据特征,并放在关键的训练数据上面。
支持向量机(SVM 包括 SVC 和 SVR)。SVM 的主要思想可以概括为两点:(1)它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空 间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性 算法对样本的非线性特征进行线性分析成为可能;(2)它基于结构风险最小化理论之上在 特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期 望风险以某个概率满足一定上界。