对于缺失数据常用的方法有删除法,替换法以及插补法.删除法以及替换法虽然简单,但是存在浪费信息以及改变数据的结构,从而可能导致有偏的统计结果.因此本文采用插补法中的回归插补法来处理数据,并利用R3。4。0软件来处理.
通过R3。4。0软件的处理,我们可以得到2001年,2002年,2003年江苏省旅行社的数目分别是847。3341,959。0238,1070。7135.具体代码以及运行结果见附录一.
2。3 实验数据整理论文网
在经过缺失数据的处理后,我们可以得到本文所要研究的数据,具体数据见下表:
表1:论文数据
年份 国内旅游收入(亿) 城镇人均可支配收入(元) 江苏省旅行社(个) 省内GDP
2。4 数据记号说明
表2:符号说明
数据名称 符号
国内旅游收入
城镇人均可支配收入
旅行社个数
GDP
国内旅游收入取对数
城镇人均可支配收入取对数
旅行社个数取对数
GDP取对数
残差
对数化国内旅游收入一阶差分
对数化国内旅游收入二阶差分
对数化城镇人均可支配收入一阶差分
对数化城镇人均可支配收入二阶差分
对数化旅行社个数一阶差分
对数化旅行社个数二阶差分
对数化GDP一阶差分
对数化GDP二阶差分
当前期对数化国内旅游收入一阶差分
当前期对数化国内旅游收入二阶差分
当前期对数化城镇人均可支配收入一阶差分
当前期对数化城镇人均可支配收入二阶差分
当前期对数化旅行社个数一阶差分
当前期对数化GDP一阶差分
当前期对数化GDP二阶差分
当前期残差
滞后一期对数化国内旅游收入一阶差分
滞后一期对数化城镇人均可支配收入一阶差分
滞后一期对数化旅行社个数一阶差分
滞后一期对数化GDP一阶差分
滞后一期残差
3 数据的平稳性检验文献综述
关于经济的时间序列数据常常呈现出明显的时间趋势,也就是说在经济震荡以后都能回到原来的时间趋势上去,但是有时还可能有随机游走的特点.如果盲目的对时间序列数据进行传统的估计方法,特别是估计变量间关系的时候,会得出错误的判断.本文所研究的数据以及变量间的协整关系对数据的平稳性有严格的要求,所以在研究协整关系时我们应该先对数据的平稳性做出判断[5].
本文采用ADF检验来判断数据的平稳性,并利用EViews8。0软件来得出结果,各个数据平稳性检验的结果如下:
表3:数据平稳性检验
变量 ADF
检验值 ADF临界值 平稳性
根据EViews8。0分析结果,我们可以看到国内旅游收入取对数,城镇人均可支配收入取对数,旅行社个数取对数,GDP取对数均为二阶单整的时间序列.研究时间序列的单整性的意义还在于,只有在变量的单整阶数相同时才有协整关系.本文所选取的变量经过ADF检验均为二阶单整,在这个基础上我们就能进行协整检验,研究协整关系.