在建立股票价格预测模型之时,我们考虑到股票市场有随机性强,非线性强,噪声大等混沌特性。所以,我们先使用奇异值降噪的方法对原始故事的序列进行降噪,在得到了肯定的结论的基础上,利用混沌理论中的相空间重构理论对样本进行重新构造,并建立混沌-SVM回归预测模型。在对SVM样本进行训练时,我们首先要解决SVM核函数的选择问题。
常用的核函数主要包括以下三类:
(1)多项式形式的核函数:
得到一个d阶多项式分类器
(2)径向基形式的核函数: (11)
所得的SVM是一种径向基分类器。径向基的应用非常的广泛,其内积函数类似于人类的视觉特性。对于不同参数值σ的选择,会出现不同的分类面,而且不同分类面之间会有较大的差别。[9]
(3)S形核函数: (12)
所得的SVM是一个两层的感知网络。与传统的感知网络不同,他并不需要人为的经验来确定,而是自动确定隐层的节点个数和网络权值。
SVM预测股价的过程主要有以下几个方面:
1、选取样本对象,提取数据
2、选取样本规模,将数据分为训练集,测试集和预测集
3、确定输入函数,并对数据进行预处理
4、确定核函数及相关参数,核函数将直接影响模型的精确度,所以我们一般采用径向基函数和多层感知机核函数作为股票预测的核函数
5、指标的选取,并训练SVM模型
6、使用测试集测试所得到的模型,如果对精确度不满意,就回到第4步重新进行指标选取并再次训练SVM模型
7、输出预测结果和预测精确度文献综述
2。4 BP神经网络
BP神经网络一般是指基于BP(误差反向传播)算法的多层前向神经网络,BP算法作为目前应用最为广泛的神经网络学习算法,他的逻辑结构由输入层,中间层和输出层三大部分构成。其中中间层(即隐含层)可以是一层或者多层。
1、在输入层中,神经元先读取回归或拟合问题的自变量数据,之后通过特定的方式进行加权处理,之后再传递给中间层的各个神经元。
2、中间层是内部信息处理层,是网络中最重要的部分,他主要负责了信息的变化处理,将来自输入层的数据计算后传递向输出层,隐含层至少含有一层,并随着人工神经网络模型的复杂性增加,隐含层的数量也会产生相应的变化。
3、输出层则是将来自中间层的输出数据进行加权及求和后作为模型的输出,求得的输出就是对目标变量的预测值。
BP网络学习算法的基本原理是梯度最速下降法,其中心思想主要表现为调整权值使得网络的总误差最小。也就是通过采用梯度搜索的技术,使得网络的实际输出值与期望输出值误差的均方值最小。所以,网络学习的过程其实是一种误差向后传播并修正权系数的过程。
BP神经网络的学习过程主要有以下两个方面组成:正向传播和反向传播。在正向传播的过程中,输入信息通过输入层经隐含层逐层处理,并最终传向输出层。其中每一层的神经元状态只是影响下一层的神经元状态。
其中,中间层中的第i个神经元的输出为:
输出层中的第k个神经元的输出为:
误差函数的定义为:
假如我们在输出层不能得到期望的输出值,则转入反向传播过程,将误差信号沿原来的连接通道原路返回,并通过修改各层神经元的权值,使误差函数降到最小。
BP神经网络的模型在有一定优势的同时,也受到来自样本特性和自身网络结构等因素的限制,存在着不少缺陷。所以,我们有必要对该模型进行适当的优化。具体方面如下所示: