最后更新于
最后更新于
两个总体之间, 我们关心:
均值之差
比例之差
方差比
如果两个样本是从两个总体中独立抽取的, 即两个样本中的元素之间相互独立, 则称为独立样本.
如果两个总体都为正态分布, 或者两个样本都是大样本, 则两个样本均值之差服从期望为, 方差为的正态分布, 因此在置信水平下的置信区间为:
当两个总体的方差未知时, 在大样本的情况下可以使用样本方差和来代替, 此时的置信区间为:
出于以下的假设, 对两个总体的均值之差做估计:
两个总体都服从正态分布
两个随机样本独立地分别抽自两个总体
分为以下几种情况:
因此置信区间为:
上面是两个样本是来自于两个总体, 是完全独立的. 而匹配样本中的两个样本的采样是有关联性的.
两个样本比例之差的抽样分布服从正态分布, 经过标准化后服从标准正态分布:
一般在比较稳定性, 精度时会使用到方差比进行比较.
两个总体的方差未知但相等, 即, 此时需要用两个样本的方差和来估计, 将两个样本的数据组合在一起, 给出新的总体方差的合并估计量:
两个样本均值之差经过标准化后, 服从自由度为的分布:
因此两个总体均值之差在置信水平下的置信区间为:
两个总体的方差未知且不相等时. 两个样本均值之差经过标准化后近似服从自由度为的分布, 其中自由度的计算公式为:
在大样本条件下, 两个总体均值之差在的置信水平下的置信区间为:
表示两个匹配样本对应数据的差值, 表示各差值的均值, 表示各差值的标准差, 总体的未知时, 可用样本差值的标准差代替.
小样本情况下, 假定两个总体各观测值的配对差服从正态分布, 则总体均值之差在的置信水平下的置信区间为:
则两个总体比例之差在置信水平下的置信区间为:
上式中使用样本比例来代替未知的总体比例.
两个样本方差比的抽样分布服从分布, 因此可以用分布来构造方差比的置信区间, 即找到满足下面条件的值:
根据之前得到的方差比的抽样分布, 有, 用左侧来代替上式中的值, 得到:
因此得到两个总体的方差比在置信水平下的置信区间为: