分布种类
抽样分布
在总体的分布类型已知时, 对任一自然数, 都能显式地推导出统计量分布的数学表达式, 把这种统计量分布称为精确的抽样分布.
精确的抽样分布大多是在总体为正态分布的情况下得到的, 对于样本量较小的统计推断问题非常有用.
统计三大分布, 就是在总体为正态分布的情况下, 得到的抽样分布:
渐进分布
借助极限工具, 寻求在样本量无限增大时, 统计量的极限分布, 这种极限分布作为抽样分布的一种近似, 称为渐进分布.
这在精确的抽样分布难以求得时有着很大的作用.
例如中心极限定理中, 统计量样本均值的分布就是一种渐进分布, 在统计学中有着重要的地位.
随机模拟获得的近视分布
很多问题的抽样分布和渐进分布都是难以求得的, 使用计算机进行随机模拟来获得某种统计量的近似分布.
由正态分布导出的重要分布
自由度可以解释为独立变量的格式, 或二次型的秩.
有如下的性质:
有以下性质:
随机变量相互对立, 且服从标准正态分布, 则它们的平方和服从自由度为的分布.
当自由度增加到足够大时, 分布的概率密度函数曲线趋于对称, 且当趋于无穷时, 分布的极限分布是正态分布.
的分位数可以查卡方分布表获得. 分位数指的是, 累计密度达到百分比时对应的, 而这是一个坐标值.
当自由度很大时(), 近视服从于, , 其中即为, 即正态分布的分位数, 因此卡方分布的分位数可以转换为计算正态分布的分位数获得.
设随机变量, , 且两者独立, 则构筑一个新的随机变量, 其分布称为分布, 记为, 其中为自由度. 分布的概率密度函数是偶函数.
分布的概率密度函数与标准正态分布相比, 曲线非常相似, 都是单峰偶函数, 只是的概率密度函数在两侧的尾部要比标准正态分布的两侧尾部粗一些, 且分布的方差大一些
随着自由度的增加, 分布的概率密度函数越来越接近标准正态分布的密度概率函数. 实际应用中, 当时, 两者就会非常的接近.
即由统计量和构造的上面的随机变量, 服从于自由度为的分布. 自由度为是因为是固定的, 少了一个自由度.
, 根据分布的定义, 将其转为标准正态分布即, 对也进行标准化, 得到, 因此按照分布的构造公式, 就能得到上面的结果.
和相互独立, , , 是来自的一个样本, 是来自的一个样本, 记:
设随机变量与相互独立, 且和分别服从自由度为和的分布, 构造随机变量, 称服从第一自由度为, 第二自由度为的分布, 记为.
分布和分布的关系: 随机变量服从分布, 则服从的分布, 这在回归分析的回归系数显著性检验中有用
T=T(X1,X2,⋯,Xn) T=T(X1,X2,⋯,Xn) X1,X2,⋯,Xn Xi(i=1,2,⋯,n) i=1∑nXi2 E(χ2)=n D(χ2)=2n χ12∼χ2(n1) χ22∼χ2(n2) χ12+χ22=χ2(n1+n2) 2χ2(n) N(2n−1,1) χp2(n)≈21(μp+2n−1)2 X∼N(0,1) Y∼χ2(n) t=T/nX D(t)=n−2n X1,X2,⋯,Xn N(μ,σ2) Xˉ=n1i=1∑nXi S2=n−11i=1∑n(Xi−Xˉ)2 Sn(Xˉ−μ)∼t(n−1) Xˉ∼N(μ,nσ2) σn(Xˉ−μ)∼N(0,1) σS2∼N(0,1) X∼N(μ1,σ2) Y∼N(μ2,σ2) X1,X2,⋯,Xn Y1,Y2,⋯,Ym Xˉ=n1i=1∑nXi Yˉ=m1i=1∑mYi Sx2=n−11i=1∑n(Xi−Xˉ)2 Sy2=m−11i=1∑m(Yi−Yˉ)2 Sxy2=n+m−2(n−1)Sx2+(m−1)Sy2 m+nmnSxy2(Xˉ−Yˉ)−(μ1−μ2)∼t(n+m−2) X=Z/nY/m=mZnY X∼F(m,n) E(X)=n−2n,n>2 D(X)=m(n−2)(n−4)2n2(m+n−2),n>4 Fp(v1,v2) Fp(v1,v2)=F1−p(v2,v1)1