本文在已有的资料基础上将对非参数统计的理论知识与应用研究的发展进行分析。 首先使用比较法使非参数统计的特点更加鲜明,然后依次介绍非参数统计随机变量,再分析中位数检验、Kolmogorov-Smironov检验、两个独立样本。 并且使用事例让大家进一步了解非参数统计的实际应用。 使大家能够进一步加深对非参数统计的了解。
1。非参数的基本特点
在许多方面非参数统计的方法被广泛的应用。 它不仅可以用于定性资料、定类、定序尺度的数据;还可以资料定量的研究分析。 例如民意的测试,研究分析群众对与几种搬迁方法支持了的差异;利用问卷调查情况,实行居民对数个超市的服务满意程度是否相同的分析研究等等。 参数统计在这些情况下都是不容易做到的。
非参数统计在大样本方法中还有着至关的重要性,大部分都是采用的非参数统计的方法,某种极限的性质都是以统计量为基础的。 在应用大样本的同时,计算者假设样本的大小已经“完全大”,大到其极限分布和相关的统计量的确切分布的差距已“完全小”。 所以应用极限分布所产生的偏离,在使用上“可以忽视”。 当定比测量尺度或者是定距的拘束能满足所有假设的参数统计时,非参数统计也可以应用在其中,但是作用却远远不如参数统计的方法。 这时,要是你还是想使用非参数统计的方法来解答时,只有增大样本的容量才是最好的补救方法,补偿使用非参数统计方法影响而带来的不完善就是应用大样本。 例如说,参数统计需要通过100的收集数据才能到达目的精确值,而至少要收集120次数据才能到达预期的目标精确值。 非参数还有一个地方是和参数方法不一样的,就是使用样本信息的方法。 统计推断的依据是样本能否充分的使用和提取样本中的信息是统计方法好坏一个很大程度上的依据,用这个来构建合理的数学统计模型。 例如极小似然的估计。总是要求已知总体的密度概率形状,因此对假设的模型参数统计有许多的针对性,模型一旦变化,随之改变的就是方法。 而非参数的方法完全不同,因为对于总体的限定非参数模型限制的较少,所以去使用样本的信息只能用很原始的方法去求,例如顺序、位置等问题。
稳健性是非参数统计的一大特点。 什么是稳健性呢?假设的理论模型相对现实的模型偏离的程度不大时,统计的方法起码不会变得很差,还是可以保证一个较为理想的性质。 以假定条件为基础的是参数统计法,如果原本的假设不成立,利用这个样的假设得出的结论就不会存在。 而非参数统计的方法有一个特别之处就是全部都带有最弱的假设,对假定的模型限定很少,所以存在天然的稳定性。
2。非参数统计常用方法分析
2。1随机变量
一个测试的答案很多都是数字,例如生产量、产品合格率、考试分数;也有的不是数字,例如一只小白鼠选择“蓝色的门”逃出笼子。 为了分析实验得出的结果,对样本中空间点的赋值是最常用的方法,所有这样的一个赋值方法被称为随机变量。
定义2。1 随机变量是定义在样本空间上点的实值函数。
由于事件与随机变量之间存在一种紧密的关系,所以在随机变量中也可以应用独立性和条件概率的定义。
定义2。2 给定时的条件概率是指在随机变量取值为时,随机变量取值为的概率,记为。
条件概率的公式
正如一个样本空间中的点是互不相容的,随机变量的取值也是互不相容的即对于试验的一个结果,定义的随机变量也只有一个取值。 这样对策随机变量所有取值的集合与样本空间有许多相同的性质。 随机变量各个单独的取值对应于样本空间中的各个点,一个取值集合则对应着一个事件,随机变量在一个数值集合内取值的概率等于它在这个集合内取每一个值的概率之和。