最后更新于
最后更新于
假设检验与参数估计是统计推断的两个部分, 都是利用样本对总体进行某种判断, 但推断的角度不同, 主要体现在:
参数估计是用样本统计量估计总体参数的方法, 总体参数在估计前是未知的
假设检验首先对的值提出一个假设, 然后利用样本信息去检验这个假设是否正确.
原假设: 用一个等式或者不等式表示问题的原假设(null hypothesis), 原假设用表示.
原假设一般是我们想要否认的情况, 通常会通过假设检验否认这个问题, 从而它的相反观点得到支持.
备择假设: 如果原假设不成立, 就要拒绝原假设, 而需要在另一个假设中做出选择, 这个假设称为备择假设(alternative hypothesis).
原假设与备择假设互斥.
我们依据样本提供的信息进行判断, 其实本质是由部分推断总体, 因此得出的判断结论就有可能是错误的. 所犯的错误有两种类型:
第I类错误: 原假设为真, 但是被我们拒绝了, 这种错误的概率用表示, 也称为错误或弃真错误
第II类错误: 原假设为假, 但是我们接受了, 这种错误的概率用表示, 也称为错误或取伪错误
假设检验中两类错误的情况如下图所示:
提出原假设和备择假设
确定适当的检验统计量, 并计算其数值. 参数的假设检验如同参数估计, 借助样本统计量进行统计推断, 这里将这个统计量称为检验统计量.
进行统计决策. 假设检验的原理是利用小概率原理, 即发生概率很小的随机事件在一次试验中是几乎不可能发生的.
判断的标准是: 将计算得到的检验统计量的数值与指定的一个小概率在选择的统计量所对应的分布中, 对应的坐标值进行比较
或者相反, 将检验统计量的数值转换成按照原假设成立情况下, 对应分布所对应的拒绝域对应的概率值, 再与指定的小概率进行比较
两者的本质是相同的
P值就是当原假设为真时, 得到的当前样本结果或更极端结果出现的概率. 如果P值很小, 说明这种情况发生的概率很小, 根据小概率原理, 我们就有理由拒绝原假设.
P值是通过计算得到的, P值得大小与三个因素有关:
样本数据与原假设之间的差异
样本量
被假设的参数的总体分布
注意:
对于P值的使用, 需要注意的一点是, P值的大小与样本量有关, 需要特别注意样本量的大小, 较大的样本会提高显著性检验的敏感度, 这是因为大样本量的情况下方差一般会因样本量的增多而减小, 导致相同的差距使用方差衡量会变大.
置信区间可以估计未知总体参数的值, 同时告诉我们不确定的程度有多大; 而显著性检验只度量不利于原假设的证据的强度.
由小概率原理, 备择假设在一次试验中不容易发生, 但一旦发生, 我们就有充足的理由推翻原假设.
对于一定的样本量, 不能同时做到减小这两类错误, 想减少某类错误的概率, 另一类错误的概率就会增加. 只有增大样本量, 才能同时降低两类错误的概率.
一般采用控制错误的原则, 这是因为原假设通常都是明确的, 而备择假设通常是模糊的.
P值反应了观察到的实际数据与原假设之间不一致的概率值, 根据事先确定的显著性水平, 针对单侧检验和双侧检验, 分别根据与拒绝原假设.
因此显著性检验不仅要看最后得出的P值, 也要参考做出这次检验的样本量.
对于显著性水平为的检验准则而言, 如果出现拒绝的结果, 可以说, 结论为真的出错概率为.
把假设检验中出现接受的结果解释为没有发现充足的证据反对, 但不能说原假设是真的. 即不拒绝不能保证为真, 这是在规定的显著性水平上无法拒绝原假设.