xij = μi + εij ,i = 1,2, ⋯ , r, j = 1,2, ⋯ , ni;
εij ~N 0, σ2 且相互独立;
将模型(2。1。3)称为单因素方差分析数学模型,它是一个线性模型。
2。1。2 单因素方差分析
式(2。1。2)等价于:H0: α1 = α2 = ⋯ = αr = 0 , H1: α1, α2 , ⋯ , αr不全为零。 (2。1。4) 若是原假设H0被拒绝,则表明影响因素 A 不同水平的效应之间有显著性差异;否则,差异
不明显。
以下导出H0的检验统计量。方差分析法是在平方和分解和自由度分解的基础上创立的,考 虑统计量:
称ST为总离差平方和(或称总变差),它是所有数据xij 与总平均值x 的差的平方和,它描绘
了所有数据的离散程度。可以证明如下平方和分解公式:
SE表示随机误差的影响。这是由于对于不变的 i 来讲,观测值xi1 , xi2 , ⋯ , xini 是来自同一
正态中体N μ , σ2 的样本。因此,它们之间的差异是由随机误差所导致的。而 ni x − x 2
是这ni个数据的变动平方和,正是它们的差异大小的度量。对 r 组这样的变动平方和进行求
和,得到SE,通常称SE为误差平方和或组内平方和。文献综述
SA表明在水平 Ai 下样本均值与总均值之间的差异和,它反映了 r 个样本总体均值间的差别。 由于x i∙是第 i 个样本总体的样本均值,它是μi 的估量,若 r 个样本总体均值μ1,μ2, ⋯ ,μr间
ni 2
的差别越大,这些样本均值x 1, x 2, ⋯ , x r之间的差异越大。平方和 r x − x 正是用来
度量这种差异大小的,其中ni阐明了第 i 个样本总体的大小在平方和 SA 中的作用。将 SA 称作
因素 A 的效应平方和或组间平方和。
式(2。1。5)表示,总平方和 ST 可按其来源分解成两个部分,一部分是误差平方和 SE,它 是由随机误差引起的。另一部分是因素 A 的效应平方和 SA,它是由因素 A 各水平间的差异引 起的。
由模型设计(2。1。1),经过统计分析得到E SE = n − r σ2 ,即 且SE ~χ2 n − r 。
σ2 SE 是σ2 的一个无偏估计,
如果假设H0 成立,则有E SA = r − 1 σ2 ,即
并且 SE 和 SA 独立。因此,当假设 H0 成立时,有:
是σ2 的一个无偏估计,且SA
F = SA r−1 ~F r − 1, n − r (2。1。6)SE n−r
于是 F 可以作为 H0 的检验统计量。对于给定的显著性水平α,用Fα r − 1, n − r 表示 F-分 布的上α分位点。若F > Fα r − 1, n − r ,则拒绝原假设,认为因素 A 的 r 个水平有显著差异。 同时可以通过计算 p 值的方法来决定是接受还是拒绝原假设 H0。其中 p 值为P F r − 1, n − r >
上市公司所属行业对投资收益影响分析(5):http://www.youerw.com/kuaiji/lunwen_87261.html