概念
假设X1X2,⋯,Xn是从总体X中抽取的容量为n的一个样本, 如果由此构造的一个函数T(X1X2,⋯,Xn), 不依赖与任何未知参数, 则称函数T(X1X2,⋯,Xn)是一个统计量, 准确的说是样本统计量.
当获取到样本的一组具体观测值x1,x2,⋯,xn时, T(x1,x2,⋯,xn)就是一个具体的统计量的值.
例如, 以下函数是统计量:
Xˉ=n1i=1∑nXi
S2=n−11i=1∑n(Xi−Xˉ)2
以下函数不是统计量, 因为期望E(X)和方差D(X)都是依赖于总体分布的未知参数:
i=1∑n[Xi−E(X)]2
[Xi−E(X)]/D(X)
意义
统计量是样本的一个函数.
统计量实际上是对样本所含的总体信息按照某种规则进行加工处理, 把分散在样本中的信息集中到统计量的树枝上.
不同的统计推断问题, 需要构造不同的统计量. 因此统计量是统计推断的基础.
常用统计量
Xˉ=n1i=1∑nXi: 样本均值, 反应总体X的数学期望
S2=n−11i=1∑n(Xi−Xˉ)2: 样本方差, 反应总体X的方差, S即为样本标准差
V=S/Xˉ: 样本变异系数, 反应总体变异系数C=D(X)/E(X), 而C反应出随机变量X的离散程度. 此统计量消除了均值不同对不同总体的离散程度的影响, 常用来刻画均值不同时, 不同样本的离散程度
mk=n1i=1∑nXik: 样本k阶矩. m1=Xˉ
vk=n−11i=1∑n(Xi−Xˉ)k: 样本k阶中心矩. v2=S2
α3=n−1i=1∑n(Xi−Xˉ)3/[i=1∑n(Xi−Xˉ)2]3/2: 样本偏度. 反映了随机变量的密度函数曲线在众数(密度函数在这一点有最大值)两边的对称偏斜性. 服从正态分布的随机变量的偏度为0
α4=(n−1)i=1∑n(Xi−Xˉ)4/[i=1∑n(Xi−Xˉ)2]2−3: 样本峰度. 反应了密度函数曲线的众数附近峰的尖峭程度. 正态分布的峰度为0.