MATLAB基于流形学习与神经网络的预测建模(3)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

MATLAB基于流形学习与神经网络的预测建模(3)

数据预测是数据分析的基本任务之一,而使用传统方法对非线性数据进行预测常常难以建立简单而有效的预测模型。人工神经网络由于其出色的非线性适应性信息处理能力,被广泛应用在非线性数据的处理中,而BP神经网络是神经网络中应用最为广泛的一类[3]。通过建立BP神经网络预测模型,借助神经网络进行曲线拟合,实现从输入到输出的函数映射。然而传统的神经网络模型对高维数据进行预测建模,会由于数据分析难度加大、导致神经网络的训练时间过长,以及相似性高的数据重复输入造成网络权值退化等问题。BP算法的本质是梯度下降算法,其目标函数的优化通常出现“锯齿形现象”

(有可能是噪声或冗余变量引起),这使得BP算法低效[4]。鉴于此,本课题提出利用流形学习算法结合前馈神经网络建立高精度的预测模型。

1.2国内外研究现状

近年来,在流形学习领域产生了大量的研究成果,涌现出很多具有代表性的特征提取方法。流形学习方法应用于嵌入在高维空间内低维流形上的数据,分为线性流形学习方法和非线性流形学习方法。线性流形学习方法有:传统的主成分分析法(PrincipalComponentAnalysis)和线性判别分析法(LinearDiscriminantAnalysis)。然而,流形数据的非线性特征给维数约简带来了很大的困难。因此,非线性流形学习更有利于数据非线性结构的提取,非线性高维数据降维算法引起了广泛的关注。等度规映射方法(ISOMAP)与局部线性嵌入法(LocallyLinearEmbedding)是两种具有代表性的非线性降维方法。Tenenbam[5]等人(2000年)提出了基于全局非线性的ISOMAP算法,基本思想是利用最近邻图中样本点的欧氏距离来计算出样本之间的测地距离。Roweis(2000年)和Saul(2004年)提出了基于局部线性的LLE算法,基本思想是在样本点和它的邻域点之间构建局部线性平面[6]。2000年Science杂志上的两篇文章:IsomapandLLE的发表标志了流形学习研究热潮的开始[7]。基于研究非线性分布数据的需要,后来大量的非线性特征提取方法被提出,如拉普拉斯特征算法(LaplacianEigenmap)、局部切空间排列算法(LTSA)等,并且广泛应用于图像处理、语音处理上。

人工神经网络(ArtificialNeuralNetwork,ANN)对人脑神经系统特性的一种模拟,广泛应用于智能控制系统、系统优化、模式识别等领域。人工神经网络由于其出色的非线性适应性信息处理能力,被广泛应用在非线性数据的处理中,实现在数据预测中的应用,其中前馈神经网络(BP神经网络)是目前应用最为广泛的神经网络模型之一。BP神经网络由Rumelhart和Meceland于1986年提出,其本质是梯度下降算法,是一种包含有输入层、隐含层和输出层的单向传播的多层前向网络[8]。基于流形学习来提取准确可靠的数据特征,来防止由于数据特征有限或重复信息造成前馈神经网络的权值退化等问题出现,进而结合前馈神经网络建立高精度的预测模型。

1.3主要研究内容

本文中提出利用流形学习方法对大量高维数据进行处理,实现数据模式特征提取与维数约简用于分析,确定输入输出数据,建立BP神经网络模型预测未来的数据趋势。通过MATLAB软件平台编程实现流形算法功能,对原始数据进行降维处理,训练BP神经网络预测模型,并且对网络仿真的预测结果和实际数据作线性回归分析,得到两者的相关系数,从而验证预测方法的稳定性和有效性。论文的主要研究内容如下:

(1)介绍了课题的研究背景和意义,国内外流形学习及人工神经网络的研究现状,分析了传统BP神经网络模型目前存在的问题。 (责任编辑:qin)