“统计学相关知识,是数据科学重要的基础之一。”
关于统计学相关的内容,上篇文章《总体、样本与统计量》分享了一些基础知识。今天分享一下关于抽样分布的内容。
01—抽样分布首先,什么是抽样分布呢?
在上篇文章中,我们介绍了统计量的概念(不含任何未知参数的样本的函数,就叫统计量),统计量的分布,就是抽样分布。
抽样分布中,最常用的分布其实是4种:z 分布(即正态分布)、卡方分布、t分布、F分布。每种分布对应假设检验中的一种检验方法,后续讲假设检验的时候再详细讲解。因此这几种分布的知识是后续重要的基础。
关于正态分布大家都比较了解,因此重点阐述一下后面的三种分布。
02—卡方分布先介绍一下卡方分布相关的内容。
(1)卡方分布的定义定义:当,则以下的统计量(即样本取平方后求和):
服从自由度为n的分布,即卡方分布。记为:。这里的自由度,指的就是独立变量的个数,因此肯定是正整数。
(2)卡方分布的图像及特点卡方分布的图像如下:
当自由度是2的时候,比较特殊,刚好是指数分布。
当自由度大于2的时候,卡方分布的曲线都是单峰曲线,在n-2处取得峰值。
曲线关于x=n-2是不对称的,当n越大,峰向右移动;当n无限大时,可以用正态分布近似。
(3)卡方分布的相关定理卡方分布的期望和方差有以下特点:
卡方分布具有可加性。当两个(或者多个)随机变量均服从卡方分布时,且相互独立,那么加和之后的分布也服从卡方分布,自由度是两个自由度之和,即:
关于卡方分布,就主要介绍这些。
03—t分布接下来我们介绍一下t分布。
(1)t分布的定义定义:当, Y服从自由度是n的卡方分布,且X、Y相互独立,则以下的统计量
服从自由度为n的t分布。因此,t分布是由标准正态分布和卡方分布构造的分布。
(2)图像及特征t分布的图像如下:
t分布是具有对称性的。
04—F分布最后我们介绍一下F分布。
(1)F分布的定义定义:当,且U、V相互独立,则以下的统计量
服从自由度为 的F分布。这里的两个自由度是有先后顺序关系的。因此,如果互换一下分子分母,很容易得出结论:
从上面很容易了解到,F分布是由两个卡方分布构造的。
(2)F分布的图像F分布的图像如下:
几个重要的分布讲完了,最后我们再介绍一下在总体是正态分布的前提下,常用统计量的分布规律。再强调一下,下面的规律都是基于总体服从正态分布的前提,这里只需要总体是正态分布即可,不需要是标准正态分布。
以下的这几个抽样分布还是很重要的,后续做区间估计的时候会用到这几个构造枢轴变量,用以进行总体参数估计。
(1)关于样本均值的分布样本均值经过以下标准化后,服从标准正态分布。
即样本均值的期望等于总体期望,样本均值的方差是总体方差的n分之一。
若将分母中的总体标准差改为样本标准差,则服从自由度为n-1的t分布:
这两个不同处理之下的不同分布,还是需要注意一下。
(2)关于样本方差的分布样本方差乘以系数后,服从自由度为n-1的卡方分布:
需要注意的是,这里的自由度是n-1,因为这里样本方差是用每个样本减去样本均值。如果改为减去总体均值,其他内容不变,则服从自由度为n的卡方分布。因为样本均值多了一个约束(均值公式),因此自由度少了一个。
(3)关于样本均值和样本方差的关系样本均值和样本方差相互独立。
(4)两个正态总体时,两样本的关系上面讲到的几个都是在单个正态总体的情况下。当有两个正态总体时,两个样本的方差和两个总体方差有以下分布:
即处理后的分布服从F分布。
另外,一种特殊情况下,当时,
其中,
关于卡方分布、t分布、F分布相关的内容就先分享到这里,欢迎继续关注~
-END-
以上就是关于抽样分布:经常听到的卡方分布、t分布等的含义是啥?巴赫旧约歌词全部的内容,关注我们,带您了解更多相关内容。
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。