可以合并为:
(1.6)
若想要得到最优超平面,即使得 为最小,那么即是解二次规划问题
(1.7)
(1.8)
引入Lagrange函数,求解出该线性问题
(1.9)
对式中的 和 求偏导,并且令其偏导数为0
(1.10)
(1.11)
解(1.10)和(1.11)可得:
把(1.12)和(1.13)代入(1.9)可得:
将目标函数换成极小,得到优化对偶的问题
线性不可分
如图1.3所示的问题,当一条直线不能把目标研究内容集合准确地分开,会产生很大的误差,这一类问题统称为线性可分问题,要使用非线性学习机。
线性不可分问题
当训练集合不能用一条直线准确分为两类时,此时我们要引入一个非负变量:
对最大间隔的要求适当的放松,可以允许有不在约束条件 的点存在,可以用式(1.20)表示:
(1.20)
解决下列最优化问题即为构造了最优超平面
(1.21)
(1.22)
(1.23)
相似的线性可分问题,也是使用Lagrange函数求解二次规划问题的
为Lagrange子向量,可得到对偶问题:
(1.24)
(1.25)
1.3.3 多元回归分析
回归分析作为数理统计学的一种方法,可以通过回归分析一组变量之间的相关性,而且可以解出表示它们相关性的函数[15]。如这是一个简单的回归问题:分析两个变量X和Y的关系。假设测得的若干个X的值和其相对应的Y值, ,根据这些数值,分析推断两个变量之间的关系。即如图1.3所示寻求一条曲线 。
回归问题 x
用数学语言描述:
给定训练集合
(1.26)
假设数据样本是按照一个概率 选取的独立分别的样本点,损失函数为 ,寻找一个相关性函数 使得期望风险
(1.27)
有最小值。
在研究多个变量之间的关系时,则要求运用多元回归分析法,它的表达式一般为:
(1.28)
模型参数是 , 是误差项, 的存在有一定的变异性。
1.4分析方法的比较
预测模型的评价指标主要是有两个,一是预测结果的精确度,二是模型的可靠性。一般而言,判定模型的好与坏是采用多项误差方法来确定的,因为只使用一种误差分析方法来评价预测模型的优劣势不可靠的[26]。这个章节会分析三个方法的数据分析特点,包括神经网络、SVM和回归分析。 基于支持向量机的TiO2/C复合材料的研究(5):http://www.youerw.com/cailiao/lunwen_28114.html