条件泊松抽样可调整参数,当参数调整到与重复泊松抽样相同时条件泊松抽样就和重复条件泊松抽样规定的包含概率相同,本文主要研究基于泊松抽样和条件泊松抽样的实际问题.
1泊松抽样
1.1定义
对每一个总体单元给予一个入样概率 使得 , 为常数,以 为成功概率,作一次伯努力试验,假如实验成功则单元入样.共作 次此试验,在这样的试验中实际入样的单元数即样本量 是随机的.有:
总体值Y的估计量我们选用Horvitz-Thompson估计,即
此时,由于 ,故:
他的一个无偏估计是:
泊松抽样下的概率函数具体形式如下:
1.2泊松抽样原理
如果 是参数为 的指数分布: ,那么此抽样具有无偏性,即不能预期新样本的达到.另外,虽然抽样设计影响了样本的形态,抽样还是具有渐近无偏性.此类 设计的 严格不放回,但 不提前固定的抽样方法我们常常称作“泊松抽样”.
每个时间段都有单独的指数分布函数,在每个间隔发生后采集一个入样样本.假如从时刻 开始,经过时间间隔 泊松试验完成 ,此过程共进行了 次试验 , 则这些测量在 内是均匀分布的.因此泊松抽样成功的关键是选取时间间隔 和试验次数 ,并在间隔 内均匀的产生 个随机抽样. 要生成泊松抽样的时间间隔 ,最初要决定样品测量的平均间隔时间的参数 如果产生 30s 的均匀抽样间隔 , 则 .然后产生一系列伪指数分布随机数 ,第一个测量时间是 ,第二个测量时间是 ,由此推算下去,产生假指数分布随机数的方法是在产生 到 之间符合均匀分布的假随机数 的基础上.许多资料资源库提供了对应的数学函数库 , 明确指出了 的公式 , 是 自然对数.
2 条件泊松抽样
2.1定义
条件泊松抽样是Hajek(1981)设计的,它是以固定样本容量 作为条件的泊松抽样设 ,作为一组试验概率,其中 ,进行泊松抽样,直到所抽到的样品数刚好等于预期的固定样品容量 相等时抽样结束.否则,继续抽样.其函数为:
从上式我们可以看出它与泊松抽样的概率函数就多一个系数 .当 这时条件泊松抽样即为严格的 抽样.
2.2重复泊松抽样
令 表示为 的一个子集,而且s的大小记为 ,令初始值 直到 的大小为 ,重复下面的步骤
(1)若 ,然后用泊松抽样的方法以概率 从 中抽取单元, ,故 ;
(2)若 ,然后用泊松抽样的方法以概率 从 中抽取单元, ,故 .
每一步的过程预期的样本量是 ,采用此种抽样方案样本规模将迅速收敛到 .这个过程得到的包含概率与条件泊松抽样的值非常接近,每个 可能出现的集合s可以作为马尔科夫链的一个状态,在这个过程的开始空集被看做马尔科夫链的第一个状态.从一个状态到另一个状态的概率是能够被计算出来的.
从状态 到状态 或是从样本 到样本 的样本概率依赖于样本 的样本量 的大小。
(1)如果 ,且 ,则 否则 ;
(2)如果 ,且 ,则 ,否则 ,其中 ;
(3)如果 ,且 ,则 ,否则 ,其中 .
由上式可知,样本大小 和样本大小 ,重复泊松抽样和条件泊松抽样是相同的,他们可以被互换. 条件泊松抽样及其应用(2):http://www.youerw.com/shuxue/lunwen_38683.html