最后更新于
最后更新于
研究一个总体时, 关心:
总体均值
总体方差
总体比例
需要考虑的条件有:
总体是否为正态分布
总体方差是否已知
构造估计量的样本的样本容量(为大样本, 反之为小样本)
这两种情况是一样的, 可以使用相同的方法进行估计. 这是因为在这两种情况下, 样本均值的抽样分布为正态分布, 均值为, 方差为, 当总体的方差未知但大样本的情况下, 可以用样本方差代替.
总体均值, 在置信水平下, 置信区间为:
其中为事先确定好的风险值, 为置信水平, 是标准正态分布右侧面积为时的值, 是估计总体均值时的估计误差.
只讨论大样本情况下总体比例的估计问题. 判断是否为大样本的标准有:
得到置信区间为:
这时的样本均值的抽样分布仍是正态分布, 但由于总体的方差未知, 又是小样本, 不能直接使用样本方差代替. 构造:
则样本均值经过标准化以后的随机变量服从自由度为的分布. 因此, 使用分布连建立总体均值的置信区间:
其中是自由度为的分布右侧面积为时的值, 可以通过查表获得.
观察与上面使用正态分布构建置信区间方法, 其单位误差都为, 但倍数分别为和, 来自于不同的分布.
区间不包含0和1
且
当样本量足够大时, 比例的抽样分布近似于正态分布. 期望为, 方差为, 样本比例标准化之后服从标准正态分布, 即:
因此, 总体比例在置信水平下的置信区间为:
上式要求是已知的, 但这正是我们要估计的, 因此用样本比例来代替(大样本保证):
只讨论正态总体的方差估计问题. 前面表明, 样本方差服从自由度为的分布, 因此用分布构造总体方差的置信区间.
给定一个显著性水平, 则总体方差的置信区间满足:
又由于, 用左侧的表达式来代替, 有: