基于前人对多元回归分析的研究成果,又结合作者对多元回归分析的理解和社会活动的实际情况,采用案例-铁路客运量,探究人口数、国内生产总值、公路客运量、铁路营业里程、居民消费水平五大因素对铁路客运量的影响。从收集数据入手,进而确定回归方程,然后进一步对参数和模型进行估计和检验,结合对软件的操作,最终得出结论。值得一提的是,本文只针对多元线性回归作了重要例证,并未对多元非线性回归做过多分析。论文网
1。多元线性回归
1。1多元线性回归模型
设有个一般变量为自变量,随机变量为因变量,如果因变量与自变量之间存在线性关系,则它们的线性回归模型为
(1。1)
在上式中,为回归常数,是个未知参数为回归系数。是随机误差,对随机误差可以假设
此时称+…+
为理论回归方程。
时,我们就称(1。1)式为多元线性回归模型。
若我们获得组观测数据(,,…,;)(=1,2,…,),则线性回归模型(1。1)式可表示为
写成矩阵形式为
其中 为了更方便地对模型的参数进行估计,需要对多元线性回归模型作一些基本假定,假定如下:
(1)自变量,,…,是确定性变量,不是随机变量,并且要保证,即说明矩阵中的自变量列之间不相关,并且样本量的个数应大于自变量的个数。以上假定都是可以预先设定的,也是可以人为控制的。
(2)随机误差项具有零均值和等方差,即
即假设观测值没有系统误差,随机误差项的平均值为零。随机误差项的协方差为零,表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关。
(3)正态分布的假定条件为
是相互独立的,对于多元线性回归的矩阵模型,这个条件便可表示为
由上述假定和多元正态分布的性质可知,随机向量服从维正态分布,回归模型的期望向量
因此1。2回归参数的估计
估计未知参数时,采用最小二乘估计法。对于回归模型最小二乘法即寻找参数的估计值使离差平方和达到最小,这样求出的 就是回归参数的最小二乘估计。
求是一个求极值问题,而又是关于的非负二次函数,根据微积分中求极值的原理,得出用矩阵形式表示的正规方程组
移项得
当存在时,即得回归参数的最小二乘估计为
称
为经验回归方程。
在求出回归参数的最小二乘估计后,可以用经验回归方程计算因变量的回归值与残差。称
为观测值的回归拟合值,简称回归值或拟合值。相应地,称向量为因变量向量的回归值。由可得文献综述
其中矩阵记为,于是,。矩阵的主对角线元素为,矩阵的迹为
根据迹的性质,得
称
为的残差。称为回归残差向量。将代入得,。记为的方差阵 ,记为。因而
于是有
残差满足关系式
即残差的平均值为0,残差对每个自变量的加权平均为零。用矩阵的形式表示为