4 PCA-SVR系统实现 18
4。1 项目结构 18
4。2 算法实现 18
4。3 接口实现 20
4。4 实验环境 21
4。5 实验结果对比 22
5 总结与展望 29
5。1 研究工作总结 29
5。2 研究展望 29
致 谢 30
参 考 文 献 31
1 绪论
1。1 问题背景和研究意义
统计学习理论(Statistical learning theory)是由Wpnik等人建立的一种专门研究小样本情况下机器学习规律的理论[1],支持向量机(Support Vector Machines),简称SVM,是在这一理论基础上发展起来的一种新的回归和分类工具。支持向量机是通过结构风险最小化的原理来提高泛化能力的[2]。在信号处理、函数逼近、模式识别等领域,支持向量机已经得到了广泛应用。支持向量机后来被推广应用到回归估计问题中,也同样取得了很好的效果。但是数据样本的重要性越大,在支持向量回归(Support Vector Regression),论文网简称SVR,训练过程中所起到的作用越大,这样才能使预测结果更符合现实要求,因此,在对数据进行训练时,考虑到不同数据样本对预测函数贡献程度的差异性,针对不同重要程度的样本应给予不同大小的权重。同时由于待预测函数的影响因素指标众多,每个指标都在不同程度上反映着某些信息,而这些信息往往存在重叠现象,用主成分分析能对原数据的许多相关属性参数重新分析组合,得到一组新的、相互无关的综合变量(主成分),用少数的几个综合参数来取代原样本的多维属性参数,对样本进行上述处理后,利用SVR对样本进行训练,得到最优的回归预测模型。
1。2 国内外研究现状
1。2。1 预测算法
1。2。2 主成分分析
1。2。3 支持向量回归
1。3论文研究内容及组织结构
本文主要研究的是基于支持向量机的回归算法来做数据预测的改进,在对数据进行训练时,考虑到不同数据样本对预测函数贡献程度的差异性,针对不同重要程度的样本应给予不同大小的权重。由于待预测函数的影响因素指标众多,每个指标都在不同程度上反映着某些信息,而这些信息往往存在重叠现象,用主成分分析能对原数据的许多相关属性参数重新分析组合,得到一组新的、相互无关的综合变量(主成分)。这些新的综合变量又能够反映较多的原数据的信息。在保证尽量减少原始数据信息的丢失的情况下,可对高维样本数据进行降维处理,并用少数的几个综合参数来取代原样本的多维属性参数。本文研究和验证这个基于主成分分析的支持向量回归算法,下文中简称PCA-SVR。论文具体内容如下:
第一章,绪论。绪论部分为本文研究内容的概述,主要说明本文研究问题的背景和国内外研究现状以及说明了本文的总体结构。
第二章,相关概念与技术。本章主要介绍了本文用到的几个技术,主成分分析,支持向量回归,支持向量机和MVC(Model-View-Controller)框架。
第三章,PCA-SVR系统设计。本章说明了本文研究的算法的验证系统的设计,主要有算法的模型和流程,系统的总体结构,接口与数据结构设计以及数据库设计,在本章的最后,还举了一个实例来验证系统的可行性。来;自]优Y尔E论L文W网www.youerw.com +QQ752018766-