2 预备知识
相关分析的目的在于测度变量之间的关系强度,它所使用的测度工具就是相关系数.而回归分析则侧重于考察变量之间的数量伴随关系,并通过一定的数学表达式将这种关系描述出来,进而确定一个或几个变量(自变量)的变化对另一个特定变量(因变量)的影响程度.[1]
一元回归模型可表述为:
式中 、 是位置参数, 为剩余残差项或称随机扰动项,引进随机扰动项 是为了包括对因变量 的变化有影响的所有其他因素.在运用回归预测时,要求满足一定的假定条
件,其中最重要的是关于 须具有的5个特性:(1) 是一个随机变量;(2) 的平均值为零,即E( )=0;(3)在每一个时期中, 的方差为一常量,即D( )= ;(4)各个 间相互独立;(5) 与自变量无关.[2]一个好的估计量应满足一致性、无偏性和有效性的要求.线性回归模型参数的估计方法通常有两种,即普通最小二乘法和最大似然估计法.最常用的是普通最小二乘法.
最小二乘法的意义在于使:
达到最小. 是实际值,而 是理论值或称估计值.根据数学分析中的求极值原理,要使 为最小,只需在式中分别对 、 求偏导数,并令其等于零.
求得的 和 的两个公式为:
3 江苏省GDP一元线性回归分析
3.1 数据的来源源:自/优尔^-论,文'网·www.youerw.com/
查阅江苏省统计局《江苏统计年鉴——2014》[3],得到江苏省2004到2014年GDO数据,如下表:
表1 江苏省2004—2014年GDP数据 (单位:亿元)
年份 江苏省DP值 年份 江苏省GDP值
2004 15003.6 2010 41425.48
2005 18598 2011 49110.27
2006 21742.05 2012 54058.22
2007 26018.48 2013 59161.8
2008 30981.98 2014 65100
2009 34457.3
3.2 数据模型选择依据
首先绘制数据散点图,根据散点图的分布选择合适的预测模型.
2004—2014江苏省GDP值
由散点图可以清晰的看出2004——2014的江苏省GDP值得图像趋于一条直线,所以我们有理由用一元线性回归预测法拟合.