截尾线性回归模型中极大似然估计的稳健性分析(2)
时间:2019-09-09 12:38 来源:毕业论文 作者:毕业论文 点击:次
Yang Liu,Wang Yu,Li Jihong在文献[6]中分析出了截尾线性回归模型中参数的极大似然估计存在的某些条件,并给出了证明及给出区间截尾的情形下参数的极大似然估计存在的一个更简单的条件. Schmee和Hahn在文献[3]中研究了带有截尾数据的回归模型的参数估计的方法,期间利用了迭代最小二乘的统计方法. 凡美金和卢梦霞在文献[7]中研究了限制线性模型中极大似然估计的稳健性在平稳过程中,用稳健性检验的方法,把稳健性用到带限制的线性模型下的极大似然估计.还对稳健性统计量的性质做了重要的分析. Dempster,Laird和Rubin在文献[4]中对于数据不完整的参数的极大似然估计(MLE),最先给出迭代算法,而后证明了它的唯一和收敛性.Murray Aitkin在文献[5]中研究了带有截尾数据回归模型参数的极大似然估计的迭代算法并给出了一定的研究结果. 本文研究的是带有截尾数据的线性回归模型参数的极大似然估计.模型为y_i="μ" _i+бξ_i,1≤i≤n,ξ_i~N(0,1)且i.i.d,其中μ_i=x^' β=∑_(j=0)^k▒〖β_j x_ij 〗,б>0,并且x_i0≡1;β 为未知的回归系数;方差σ>0为未知参数;分布函数∅(y)=∫_(-∞)^y▒φ(t) dt;正态分布的密度函数为φ(y)=1/2π e^(-y^2/2).这里假设: -∞<a_i≤y_i≤b_i<∞,m+1≤i≤n; y_i (1≤i≤m)是精确值. Murray Aitkin右截尾数据的情况是本文的一个特殊的例子.本文将对截尾线性回归模型中参数的极大似然估计和性质进行研究,进而构造稳健性统计量并对其性质进行证明,最后利用软件产生随机数据对其进行模拟,进而对所研究的模型所构造出的稳健性统计量的性质进行分析,得出结论. 截尾线性回归模型 截尾线性回归模型 y_i="μ" _i+бξ_i,i=1,2,⋯,n, ξ_i~N(0,1)且i.i.d,其中б>0,μ_i=x^' β=∑_(j=0)^k▒〖β_j x_ij 〗, β 为未知的回归系数;方差σ>0为未知参数,y_i~N(x^' β,б^2),x^'=(1,x_i1,x_i2,⋯x_ik). 不失一般性,假定观测值y_i 包含如下四种情形: (a)-∞=a_i<y_i<b_i<∞,1≤i≤r_1;(左截尾) (b)-∞<a_i<y_i<b_i=∞,r_1+1≤i≤r_2;(右截尾) (c) -∞<a_i<y_i<b_i<∞,r_2+1≤i≤r;(区间截尾) (d)y_i为精确值,r+1≤i≤n,其中a_i,b_i为常数,〖0≤r〗_1≤r_2≤r≤n; 则似然函数及其对数分别为 L(μ,б^2)=∏_(i=1)^n▒〖(1/(√2π σ) exp(-(x_i-μ)^2/2б^2))〖=(2〖πб〗^2 )〗^(-2/n) exp(-∑_(i=1)^n▒(x_i-μ)^2/(2б^2 ))〗 则 lnL(μ,б^2 )=-∑_(i=1)^n▒〖(x_i-μ)^2/〗 2б^2-n ln〖б^2/2〗-n ln2π 将lnL(μ,б^2 )分别关于两个分量求偏导并令其为0即得到似然方程组 (∂ lnL(μ,б^2 ))/∂μ=∑_(i=1)^n▒(x_i-μ) 〖/б〗^2=0 (∂ lnL(μ,б^2 ))/(∂б^2 )=∑_(i=1)^n▒〖(x_i-μ)^2/〗 2б^4-n/2б^2=0 解此方程组,由可得 μ 的最大似然估计为: μ ̂=∑_(i=1)^n▒〖(x_i )/〗 n=x ̅ 继而得到一组参数估计量 β ̂ ,即为参数的最大似然估计: β ̂=〖(x'x)〗^(-1) x'y 还可得 б^2 的最大似然估计:σ ̂^2=∑_(i=1)^n▒〖(x_i-x ̅ )^2/〗 n 显然得到的结果与参数的普通最小二乘估计是相同的.方差是用来衡量估计值与参数真值之间波动大小的量,因此估计围绕参数真值的波动越小越好.回归系数与真值之间相差越小,说明模拟的回归方程越接近真实情况,这样得到的回归模型才更符合实际要求. (责任编辑:qin) |