样本均值的分布
中心极限定理
从均值为μ, 有限方差为σ2的任意总体中抽取样本量为n的样本, 当n充分大时, 样本均值Xˉ的抽样分布近似服从均值为μ, 方差为σ/n的正态分布.
中心极限定理要求n必须充分大, 实际应用中, 常要求n≥30
样本比例的分布
总体中, 具有某一特征的比例为π(真实值), 当从总体中随机抽取n个个体, 符合这个特征的个体数量为X, 则样本比例可以用p^=nX来表示, 作为总体比例π的估计.
每个个体的抽取相当于一个二项分布. 根据二项分布的期望和方差的公式, 以及中心极限定理, 可以得到当n充分大时, p^的分布可用正态分布去逼近, 此时满足p^∼N(π,nπ(1−π))
两个样本平均值之差的分布
从两个不同的总体中选出两个独立的随机样本, 它们的平均值Xˉ1和Xˉ2之差的抽样分布是什么样子的呢?
假设两个总体分别是X1∼N(μ1,σ12), X2∼N(μ2,σ22), 样本的容量为n1, n2, 即都是正态分布, 则Xˉ1−Xˉ2也是正态分布, 且有:
E(Xˉ1−Xˉ2)=μ1−μ2
D(Xˉ1−Xˉ2)=n1σ12+n2σ22
两个样本比例之差的分布
两个总体此时为参数为π1和π2的二项总体, 样本容量依然为n1和n2. 当n1和n2很大时, (p1−p2)的抽样分布近似于正态分布:
E(p^1−p^2)=π1−π2
D(p^1−p^2)=n1π1(1−π1)−n2π2(1−π2)
样本方差的分布
样本方差的分布就比较复杂了, 这里只说总体为正态分布的情况, 对于正态整体N(μ,σ2), 样本方差S2的分布为:
(n−1)S2∼χ2(n−1)
即满足自由度为n−1的卡方分布.
两个样本方差比分布
同样要求两个样本都是正态分布, 即X∼N(μ1,σ12), Y∼N(μ2,σ22), 则有:
Sy2/σ22Sx2/σ12∼F(n1−1,n2−1)
即满足第一自由度为n1−1, 第二自由度为n2−1的F分布.