但我们可以发现,当前粮食生产还存在着许多问题。以江苏省为例,近些年由于第二、第三产业的崛起,大量的耕地被占用。96年至03年间,粮食产量急剧减低,03年达到最低点。虽然此后粮食产量在逐渐增长,但涨幅比较平缓。这种形式与当前经济发展的水平有些失衡。因此,对于粮食产量问题的研究是必要的。
由于本文的研究课题具有很强的实用性,前人已经做了许多类似的研究。本文也借鉴了这些文章,汲取了一些优秀的部分。如李妍写的中国粮食生产因素及地区差异分析,是对我国不同地区的地理差异进行分析,针对不同地区的特点,给出影响粮食产量的主要因素[1]。本文据此分析了影响江苏省粮食产量的因素。再如周永生等著的基于多元线性回归的广西省粮食产量预测这篇文章,是基于多元线性对广西省粮产的分析[2]。本文据此给出了江苏省粮食产量的相关分析。
多元回归包括线性和非线性,而非线性问题比较复杂,由于掌握的知识有限,本文仅以多元线性回归模型为例对江苏省粮食产量进行简要分析,以简化研究的复杂度。本文使用SPSS统计软件对数据进行分析。SPSS是一款使用起来比较简单的统计软件,使用起来比较方便。本文的主要目的就是希望通过简单而直观的数学模型来分析影响江苏省粮食产量的因素,以给出合理的相关建议。
2 理论介绍
当被解释变量 只与一个解释变量 有关时,我们称之为一元线性回归。而实际问题中,影响某现象的因素往往不止一个,即,被解释变量 与多个解释变量 有关时,我们需要进一步讨论多元回归问题。[3]
2。1 多元线性回归模型的一般形式
设随机变量 与一般变量 的线性回归模型为
其中, 是 个未知参数, 称之为回归常数, 称为回归系数。 称为被解释变量,即因变量; 是 个可精确测量并控制的一般变量,称为解释变量,即自变量。当 时,我们称(2。1)式为多元线性回归模型。 是随机误差,对于随机误差 ,我们有以下假定,(2。2)来自优I尔Y论S文C网WWw.YoueRw.com 加QQ7520~18766
对于一个实际问题,若获得 组观测数据( )( ),则公式(2。1)式可表示为
2。2 多元线性回归方程的解释
如式(2。1),对含有 个自变量的多元线性回归而言,每个回归系数 表示在回归方程中其他自变量保持不变的情况下,自变量 每增加一个单位时因变量 的平均增加程度。
2。3 回归参数的估计
多元线性回归方程未知参数 的估计可采用最小二乘估计。对于 (2。3)式,最小二乘估计即寻找参数 的估计值 ,使得离差平方和(2。4)
达到最小。[3]
对式(2。4)求偏导,得 满足(2。5)
2。4 回归方程的检验
2。4。1 F检验
F检验是检验自变量 整体对因变量 是否有显著想的影响。首先,提出原假设,
,
再构造检验统计量,(2。6)
最后作出决策,对给定显著性水平 ,查表得临界值 。当 时,作出拒绝原假设的决定,认为在显著性水平 下, 与 显著线性相关;当 时,认为回归方程不显著[4]。
2。4。2 t检验
当回归方程显著时不代表每个自变量都对 有显著影响,我们需要保留显著的自变量,而剔除不显著的自变量。这就需要对回归系数进行t检验。提出原假设
再构造检验统计量(2。7)
其中,(2。8)
最后作出决策,对给定显著性水平 ,查表得临界值 。当 时,拒绝原假设,认为自变量 对因变量 的线性关系显著;否则,认为不显著[4]。