双因素方差分析
当方差分析中涉及两个分类型自变量时, 称为双因素方差分析(two-way analysis of variance).
分析的内容为: 是其中一个因素起作用, 还是两个因素都起作用, 还是两个因素都不起作用. 此外, 如果两个因素之间相互独立, 此时的双因素方差分析称为无交互作用的双因素方差分析, 但如果两个因素搭配产生新的影响, 即两个因素结合后产生新效应, 此时的双因素方差分析称为有交互作用的双因素方差分析, 称为可重复双因素分析.
无交互作用的双因素方差分析
假设两个因素, 一个有k个水平, 一个有r个水平, 这样一共就有kr个分组, 每组取一个观测数据, 因此共有kr个观测数据. 并把一个定为行因素, 另一个为列因素, 定义:
xˉi⋅是行因素的第i个水平下的各个观测值的均值, 即xˉi⋅=rj=1∑rxij
xˉ⋅j是列因素的第j个水平下的各个观测值的均值, 即xˉ⋅j=ki=1∑kxij
xˉˉ是全部kr个样本数据的总平均值, 即xˉˉ=kri=1∑kj=1∑rxij
双因素方差分析的步骤如下.
分析步骤
提出假设, 需要对两个因素分别提出假设, 即有两个假设:
H0=μ1=μ2=⋯=μk, 即行因素对因变量没有显著影响
H0=μ1=μ2=⋯=μr, 即列因素对因变量没有显著影响
构造检验统计量
总平方和是全部样本观测值xij与总的样本均值xˉˉ的误差平方和, 记为SST:
SST=i=1∑kj=1∑r(xij−xˉˉ)2=i=1∑kj=1∑r(xi⋅−xˉˉ)2+i=1∑kj=1∑r(x⋅j−xˉˉ)2+i=1∑kj=1∑r(xij−xi⋅−x⋅j+xˉˉ)2
SST=SSR+SSC+SSE
SST可以分解为SSR, SSC, SSE. 三者对应上式中右侧因此的三项, 分别代表这行因素的影响, 列因素的影响和去掉行和列因素之外的剩余因素所产生的误差平方和, 三者的自由度分别为:
SSE: (k−1)(r−1)
再计算各值对应的均方:
MSR=k−1SSR
MSC=r−1SSC
MSE=(k−1)(r−1)SSE
计算行因素对因变量是否显著的统计量:
FR=MSEMSR∼F(k−1,(k−1)(r−1))
计算列因素对因变量是否显著的统计量:
FC=MSEMSC∼F(r−1,(k−1)(r−1))
统计决策
计算出检验统计量后, 根据给定的显著性水平α和两个自由度, 查F分布表得到相应的临界值Fα, 然后将F与Fα比较, 如果FR>Fα, 认为行因素对因变量有显著影响; 如果FC>Fα, 认为列因素对因变量有显著影响.
关系强度的测量
R2=SSTSSR+SSC
将行平方和与列平方和加载一起, 度量了两个自变量对因变量的联合效应, 联合效应与总平方和的比值R2, 其平方根R反映了两个自变量合起来与因变量之间的关系强度.
有交互作用的双因素方差分析
与无交互作用相比, 在进行分析时, 仍然分为kr组, 但是每组的观测值由之前的1个变为现在的m个, 即每组都有m个观测数据, 且所有组都有m个观测数据. 定义:
xijl为行因素第i个水平, 列因素第j个水平, 对应组的第l个观测值
xˉi⋅是行因素的第i个水平下的各个观测值的均值
xˉ⋅j是列因素的第j个水平下的各个观测值的均值
xˉij是行因素第i个水平, 列因素第j个水平对应组合的样本均值
xˉˉ是全部kr个样本数据的总平均值
现在构建统计量, 仍然从平方和开始:
总平方和: SST=i=1∑kj=1∑rl=1∑m(xijl−xˉˉ)2
行变量平方和: SSR=rmi=1∑k(xˉi⋅−xˉˉ)2
列变量平方和: SSL=kmj=1∑r(xˉ⋅j−xˉˉ)2
交互作用平方和: SSRC=mi=1∑kj=1∑r(xˉij−xˉ⋅j−xˉ⋅j+xˉˉ)2
误差平方和: SSE=SST−SSR−SSC−SSRC
对应的自由度为:
SSRC: (k−1)(r−1)
SSE: kr(m−1)
然后计算得到对应的均方/方差: MSR, MSC, MSRC, MSE. 计算得到三个F值, 分别为行影响FR, 列影响FC, 行列交互影响FRC, 然后分别于显著性水平α对应的Fα对比, 如果大于这个值, 就说明对应的影响是显著的.