总体均值的区间估计
研究一个总体时, 关心:
需要考虑的条件有:
构造估计量的样本的样本容量(n≥30为大样本, 反之为小样本)
正态总体, 方差已知
非正态总体, 大样本
这两种情况是一样的, 可以使用相同的方法进行估计. 这是因为在这两种情况下, 样本均值xˉ的抽样分布为正态分布, 均值为μ, 方差为σ2/n, 当总体的方差未知但大样本的情况下, 可以用样本方差s2代替σ2.
总体均值μ, 在1−α置信水平下, 置信区间为:
xˉ±zα/2nσ
其中α为事先确定好的风险值, 1−α为置信水平, zα/2是标准正态分布右侧面积为α/2时的z值, zα/2nσ是估计总体均值时的估计误差.
正态总体, 方差未知, 小样本
这时的样本均值xˉ的抽样分布仍是正态分布, 但由于总体的方差未知, 又是小样本, 不能直接使用样本方差s2代替σ2. 构造:
t=s/nxˉ−μ∼t(n−1)
则样本均值经过标准化以后的随机变量服从自由度为n−1的t分布. 因此, 使用t分布连建立总体均值μ的置信区间:
xˉ±tα/2ns
其中tα/2是自由度为n−1的t分布右侧面积为α/2时的t值, 可以通过查表获得.
观察与上面使用正态分布构建置信区间方法, 其单位误差都为ns, 但倍数分别为zα/2和tα/2, 来自于不同的分布.
总体比例的区间估计
只讨论大样本情况下总体比例的估计问题. 判断是否为大样本的标准有:
区间p±2p(1−p)/2不包含0和1
np≥5且n(1−p)≥5
当样本量足够大时, 比例p的抽样分布近似于正态分布. 期望为E(p)=π, 方差为σp2=nπ(1−π), 样本比例标准化之后服从标准正态分布, 即:
z=π(1−π)/np−π∼N(0,1)
因此, 总体比例π在1−α置信水平下的置信区间为:
p±zα/2nπ(1−π)
上式要求π是已知的, 但这正是我们要估计的, 因此用样本比例p来代替π(大样本保证):
p±zα/2np(1−p)
总体方差的区间估计
只讨论正态总体的方差估计问题. 前面表明, 样本方差服从自由度为n−1的χ2分布, 因此用χ2分布构造总体方差的置信区间.
给定一个显著性水平α, 则总体方差σ2的置信区间满足:
χ1−α/22≤χ2≤χα/22
又由于σ2(n−1)s2∼χ2(n−1), 用左侧的表达式来代替χ2, 有:
χ1−α/22≤σ2(n−1)s2≤χα/22
得到置信区间为:
χα/22(n−1)s2≤σ2≤χ1−α/22(n−1)s2