抽样分布:经常听到的卡方分布、t分布等的含义是啥?

数据管道

共 1570字,需浏览 4分钟

 ·

2021-03-26 14:54

 统计学相关知识,是数据科学重要的基础之一。



01

抽样分布


首先,什么是抽样分布呢?


在上篇文章中,我们介绍了统计量的概念(不含任何未知参数的样本的函数,就叫统计量),统计量的分布,就是抽样分布


抽样分布中,最常用的分布其实是4种:z 分布(即正态分布)、卡方分布、t分布、F分布。每种分布对应假设检验中的一种检验方法,后续讲假设检验的时候再详细讲解。因此这几种分布的知识是后续重要的基础。


关于正态分布大家都比较了解,因此重点阐述一下后面的三种分布。



02


卡方分布


先介绍一下卡方分布相关的内容。


(1)卡方分布的定义


定义:当 ,则以下的统计量(即样本取平方后求和):



服从自由度为n的分布,即卡方分布。记为:。这里的自由度,指的就是独立变量的个数,因此肯定是正整数。


(2)卡方分布的图像及特点


卡方分布的图像如下:


  • 当自由度是2的时候,比较特殊,刚好是指数分布。

  • 当自由度大于2的时候,卡方分布的曲线都是单峰曲线,在n-2处取得峰值。

  • 曲线关于x=n-2是不对称的,当n越大,峰向右移动;当n无限大时,可以用正态分布近似。


(3)卡方分布的相关定理


卡方分布的期望和方差有以下特点:



卡方分布具有可加性。当两个(或者多个)随机变量均服从卡方分布时,且相互独立,那么加和之后的分布也服从卡方分布,自由度是两个自由度之和,即:



关于卡方分布,就主要介绍这些。



03


t分布


接下来我们介绍一下t分布。


(1)t分布的定义


定义:当 , Y服从自由度是n的卡方分布,且X、Y相互独立,则以下的统计量




服从自由度为n的t分布。因此,t分布是由标准正态分布和卡方分布构造的分布。


(2)图像及特征


t分布的图像如下:


t分布是具有对称性的。



04


F分布


最后我们介绍一下F分布。


(1)F分布的定义


定义:当,且U、V相互独立,则以下的统计量



服从自由度为  的F分布。这里的两个自由度是有先后顺序关系的。因此,如果互换一下分子分母,很容易得出结论:



从上面很容易了解到,F分布是由两个卡方分布构造的。


(2)F分布的图像


F分布的图像如下:




05


正态总体下的抽样分布


几个重要的分布讲完了,最后我们再介绍一下在总体是正态分布的前提下,常用统计量的分布规律。再强调一下,下面的规律都是基于总体服从正态分布的前提,这里只需要总体是正态分布即可,不需要是标准正态分布


以下的这几个抽样分布还是很重要的,后续做区间估计的时候会用到这几个构造枢轴变量,用以进行总体参数估计。


(1)关于样本均值的分布


样本均值经过以下标准化后,服从标准正态分布。



即样本均值的期望等于总体期望,样本均值的方差是总体方差的n分之一。


若将分母中的总体标准差改为样本标准差,则服从自由度为n-1的t分布:



这两个不同处理之下的不同分布,还是需要注意一下。


(2)关于样本方差的分布


样本方差乘以系数后,服从自由度为n-1的卡方分布:



需要注意的是,这里的自由度是n-1,因为这里样本方差是用每个样本减去样本均值。如果改为减去总体均值,其他内容不变,则服从自由度为n的卡方分布。因为样本均值多了一个约束(均值公式),因此自由度少了一个。


(3)关于样本均值和样本方差的关系


样本均值和样本方差相互独立。


(4)两个正态总体时,两样本的关系

上面讲到的几个都是在单个正态总体的情况下。当有两个正态总体时,两个样本的方差和两个总体方差有以下分布:



即处理后的分布服从F分布。


另外,一种特殊情况下,当时,



其中,




关于卡方分布、t分布、F分布相关的内容就先分享到这里,欢迎继续关注~

浏览 80
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报