2 股市预测的常用建模方法
股票作为典型的非线性系统,如果我们用传统的线性建模方法来分析股票价格的时间序列时,将会得出错误的,类似随机行走理论一样的结果。因此,我们将股票系统看作是一种非线性的黑箱动力系统,我们无法用一种准确的动力方程去描述一个黑箱系统,因此我们需要从市场过去呈现的规律中找出类似的映射,来对股票系统的时间序列进行短期预测。在研究国内外文献后,我们发现描述黑箱模型的方法有主要以下几种:
2。1 ARMA差分自回归滑动平均模型
ARMA方程是通过模型参数的选择以及模型系数的辨识来实现对于非线性时间序列的拟合。在拟合后,通过已经建立好并符合待拟合曲线的模型来进行对未来趋势的预测,是一种较为成熟的预测方法。对于股市预测来说,该模型常用来对股价(包括最高价,最低价,开盘价,收盘价等)和股票综合指数(包括上证,深证指数等)进行预测。ARNA方程从本质上来说就是对于随机时间序列的分析,而随机过程理论是则随机时间序列分析的数学基础,其通过对时序数据的分析,来完成对时序系统的粗略预测,数学建模和简单控制。这种方法的基本思想是把观测到的时序数据作为系统的一维或者多维输出,之后将该模型描述为和输出同维的系统,但是该系统是由白噪声所驱动的。[4]所以随机时序分析所处理的对象一般是线性系统和同质的非线性系统(即能转化成为线性系统的非线性系统)的时序数据。
时间序列分析作为一种有效的短期预测方法,又分为自回归过程模型和移动过程模型两个大类。其中,自回归模型是以滞后变量为依据,来推算未来值,而移动过程模型是以过去的误差项为依据,来推算未来值。[5]有时我们要两者一起用,以便产生更加准确的回归移动平均模型。
下面具体给出模型的数学公式:
2。1。1 滑动平均模型(MA)
在此模型中,序列{x}的当前值是由序列{e}从当前值向前推长度为N的敞口内序列的值决定。
2。1。2 自回归模型(AR) (2)
在此模型中,序列{x}的当前值是由序列{e}的当前值和序列{x}的长度为m前一个窗口内的序列值所决定的。
2。1。3 自回归——滑动平均模型(ARMA)
ARMA模型是由MA和AR两个模型组合而成的,其公式如下:
在上式中,序列{x}的当前值是由序列{e}的当前值从这个值向前推长度为N的窗口内序列值和序列{x}的前一个长度为m的序列值所一起决定的。
我们由上述时间序列的特性可知,ARMA模型所适用的对象应该是均值为零的平稳随机序列。但我们在实际建模时,建模对象又包括确定的非随机分量。[5]所以,在建模前需要对观测数据序列进行平稳化处理。其具体的建模步骤如下:
1、通过不同方法取得被观测系统的时间序列数据,并进行颗粒化处理
2、根据得到的颗粒化数据做出动态数据图,进行分析,并求出其自相关函数
3、先辨识合适的随机模型,使用经验法,从最低阶开始逐步增加阶数,并对相应模型的参数进行辨识
在股票的指数预测和价格预测方面,ARMA模型有在某一时期误差相对较小,而在另一时期误差又相对过大的问题,其误差具有随时间而变化的规律。并且,ARMA模型使用的前提条件是平稳随机过程,也就是单变量且同方差的线性时间序列。然而,股票的指数和价格具有非平稳性,异方差性的特点,导致ARMA模型逐渐被其他模型所取代。