0x02 单个总体参数的区间估计

总体均值的区间估计

研究一个总体时, 关心:

  • 总体均值μ\mu

  • 总体方差σ2\sigma^2

  • 总体比例π\pi

需要考虑的条件有:

  • 总体是否为正态分布

  • 总体方差是否已知

  • 构造估计量的样本的样本容量(n30n\ge30为大样本, 反之为小样本)

正态总体, 方差已知

非正态总体, 大样本

这两种情况是一样的, 可以使用相同的方法进行估计. 这是因为在这两种情况下, 样本均值xˉ\bar{x}的抽样分布为正态分布, 均值为μ\mu, 方差为σ2/n\sigma^2/n, 当总体的方差未知但大样本的情况下, 可以用样本方差s2s^2代替σ2\sigma^2.

总体均值μ\mu, 在1α1-\alpha置信水平下, 置信区间为:

xˉ±zα/2σn\bar{x}\pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}}

其中α\alpha为事先确定好的风险值, 1α1-\alpha置信水平, zα/2z_{\alpha/2}标准正态分布右侧面积为α/2\alpha/2时的zz值, zα/2σnz_{\alpha/2}\frac{\sigma}{\sqrt{n}}是估计总体均值时的估计误差.

正态总体, 方差未知, 小样本

这时的样本均值xˉ\bar{x}的抽样分布仍是正态分布, 但由于总体的方差未知, 又是小样本, 不能直接使用样本方差s2s^2代替σ2\sigma^2. 构造:

t=xˉμs/nt(n1)t=\frac{\bar{x}-\mu}{s/\sqrt{n}}\sim t(n-1)

则样本均值经过标准化以后的随机变量服从自由度为n1n-1tt分布. 因此, 使用tt分布连建立总体均值μ\mu的置信区间:

xˉ±tα/2sn\bar{x}\pm t_{\alpha/2}\frac{s}{\sqrt{n}}

其中tα/2t_{\alpha/2}是自由度为n1n-1tt分布右侧面积为α/2\alpha/2时的tt值, 可以通过查表获得.

观察与上面使用正态分布构建置信区间方法, 其单位误差都为sn\frac{s}{\sqrt{n}}, 但倍数分别为zα/2z_{\alpha/2}tα/2t_{\alpha/2}, 来自于不同的分布.

总体比例的区间估计

只讨论大样本情况下总体比例的估计问题. 判断是否为大样本的标准有:

  • 区间p±2p(1p)/2p\pm 2\sqrt{p(1-p)/2}不包含0和1

  • np5np\ge5n(1p)5n(1-p)\ge5

当样本量足够大时, 比例pp的抽样分布近似于正态分布. 期望为E(p)=πE(p)=\pi, 方差为σp2=π(1π)n\sigma^2_p=\frac{\pi(1-\pi)}{n}, 样本比例标准化之后服从标准正态分布, 即:

z=pππ(1π)/nN(0,1)z=\frac{p-\pi}{\sqrt{\pi(1-\pi)/n}}\sim N(0,1)

因此, 总体比例π\pi1α1-\alpha置信水平下的置信区间为:

p±zα/2π(1π)np\pm z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}}

上式要求π\pi是已知的, 但这正是我们要估计的, 因此用样本比例pp来代替π\pi(大样本保证):

p±zα/2p(1p)np\pm z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}

总体方差的区间估计

只讨论正态总体的方差估计问题. 前面表明, 样本方差服从自由度为n1n-1χ2\chi^2分布, 因此用χ2\chi^2分布构造总体方差的置信区间.

给定一个显著性水平α\alpha, 则总体方差σ2\sigma^2的置信区间满足:

χ1α/22χ2χα/22\chi^2_{1-\alpha/2}\le\chi^2\le\chi^2_{\alpha/2}

又由于(n1)s2σ2χ2(n1)\frac{(n-1)s^2}{\sigma^2}\sim \chi^2(n-1), 用左侧的表达式来代替χ2\chi^2, 有:

χ1α/22(n1)s2σ2χα/22\chi^2_{1-\alpha/2}\le\frac{(n-1)s^2}{\sigma^2}\le\chi^2_{\alpha/2}

得到置信区间为:

(n1)s2χα/22σ2(n1)s2χ1α/22\frac{(n-1)s^2}{\chi^2_{\alpha/2}}\le\sigma^2\le\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}}

最后更新于

这有帮助吗?