统计样本的定义:彻底理解中心的极限定理
中心极限定理(CLT)它是统计学中的基本定理,也是一个非常简单的概念。当你进一步阅读时,你会发现这也是一个非常重要的概念。在阅读任何其他正态分布之前,您必须了解一个先决条件概念。请阅读我关于正态分布的文章,并彻底了解正态分布-强大的数学分析工具。这是中心极限定理的完美前传。
准确定义中心极限定理:
中心极限定理(CLT)如果样本量足够大,则变量平均采样分布与正态分布相似,与变量的整体分布无关。
解码晦涩的定义
让我们直接进入一些例子!
选择均匀分布[0,1],称为均匀分布,因为0和1之间选择值的概率相等,因此其概率密度函数(PDF)这是一条水平线。现在,让我们假设我们从这个分布中随机抽取20个样本(绿点),并计算这些样本的平均值,在这个例子中得到一个值0.5,用虚线表示。让我们在直方图上画出这个平均值。到目前为止,柱状图只有一个平均值,它没有告诉我们任何其他信息(左图)。我们开始从相同的分布中提取更多的随机样本,计算平均值,并在直方图上绘制平均值。
随着我们从均匀分布中提取越来越多的随机样本,并在直方图上绘制平均样本,我们得到了以下正态分布结果(见右曲线)。
我们从统一的数据分布开始,但从中提取的样本是正态分布。
在第二个例子中,让我们遵循与第一个例子相同的步骤,唯一的区别是我们必须从指数分布中提取样本。
我们将再次随机抽取20个样本,计算样本的平均值,并在方形图上绘制。我们熟悉计算100个样本的平均值并在方形图上绘制。样本的平均值为正态分布!
推论:我们从指数数据分布开始,但提取样本的平均值得到正态分布。
我们从指数数据分布开始,但从中提取的样本都是正态分布的。
因此,它在这一点上变得非常直观,中心极限定理意味着什么?
即使数据分布不正常,中心极限定理也意味着从中提取的样本平均分布正常。
知道样本平均值总是正态分布的实际含义是什么?
在分析领域,我们每天都会遇到各种各样的数据,源数据的分布并不总是我们所知道的。然而,由于我们了解中心的极限定理,我们甚至不需要关心源数据的分布,因为我们总是可以得到正确的分布。
为了使中心极限定理工作,我们必须能够计算样本的平均值。有一个分布叫柯西分布,没有样本平均值,所以中心极限定理论不适用于它,除了中心极限定理,我没有遇到任何其他分布。
以下是平均正态分布的实际含义:
我们可以用均值的正态分布来分配信区间。我们可以T本文涵盖了我们在处理数据和样本时应该知道的中心极限定理的整个理论。
毕业证样本网创作《统计样本的定义(中的)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/171250.html