这就写,这就写,请不要脱粉
本短文介绍了总体、样本、总方差、样本方差、抽样方差和标准误差等概念以及它们之间的一些关系。因为一些外文材料的翻译不善以及老师课堂教学中的不重视,我身边仍有许多人将它们混淆。
本文的参考资料主要包括Angrist和Pischke的《Mastering`metrics》以及Wooldridge的《IntroductoryEconometrics(Fifthedition)》。
1总方差和样本方差
总体和样本
首先提一下整体(population)”和“样本(sample)两个概念。总的来说,它包含了我们研究的目标群体中所有的个人数据,比如2008年所有海归科学家的年龄;样本只包含一些个人数据。假设2008年有10万海归科学家,我们努力找到了1万人。这1万人的年龄就是刚才的样本。当然,总体和样本是一个相对的概念。如果有人觉得1万个数据还是太难做,随机抽取100个数据,那么1万个数据就成了整体。
虽然样本和整体是相对的概念,但在大多数情况下,我们谦虚地认为我们手中的数据只是一个样本,是通过抽样整体获得的,或者我们的研究问题总是使直接研究整体不可行。人们称整体统计为整体统计XX(populationxxx)将样本的统计量称为样本XX(samplexxx)”。
我们用Y来表达2008年海归科学家的年龄(randomvariable)。请注意,随机变量之所以得名,是因为它所取的值是由随机试验产生的,而不是因为它本身是随机的,其中有细微的差异。
总方差和样本方差
在这里,我们区分两种方差,总体方差(populationvariance)样本方差(samplevariance)”。简单地说,整体方差是整体方差计算方法的结果:样本的含义
这意味着整体中所有数据的平均值,即总体平均值(populationmean)。总体平均值也被称为数学期望,后者被记录下来E(Y)。N数据整体数据的数量。N能为正无穷,说明这个整体是无穷的。
然而,如何计算具体样本的样本方差取决于其用途。由于实际上很难获得整体方差,人们经常使用样本方差来估计整体方差,例如在构建某些统计量时。此时,为了确保估计的无偏差(unbiasedness,以后详解),样本方差的计算公式就是:样本的含义
其中(读作Ybar)表示样本中所有数据的平均值,即样本平均值(samplemean)”。n表示样本容量,即样本中数据的数量。请注意,分母不是n而是n-1。但是,如果您只想用它来显示样本中数据的离散程度,则此处无需除以样本方差n-1了,除以n就好了。
方差的算术平方根称为标准差(standarddeviation)”,“deviation偏差是指平均值的偏差。当然,标准差也分为总体标准差(populationstandarddeviation)样本标准差(samplestandarddeviation)”。
在EXCEL在内部,方差和标准差分别有整体版本和样本版本,其中样本版本的分母是数据减少1,请根据需要仔细使用。
2抽样方差和标准误差
样本平均值的随机变量
刚才提到,Y的样本均值(samplemean)也就是说,在变量符号上加一条横线。因为每个从Y一般来说,随机抽样可以得到一个,所以根据定义,它也是一个随机变量,它也有一个整体,样本等等。这里可能有点抽象,它的整体是什么?是给定的样本容量n,收集所有可能样本的平均值。
总体方差称为抽样方差(samplingvariance)”,请注意与样本方差(samplevariance)区分。总体标准差称为标准误差(standarderror)还记作。
标准误差是一个非常重要的统计数据,因为我们认为我们手头的数据只是一个样本,而不是一个整体。因此,在建立数学模型并用手头的数据估计变量系数后,我们通常会问自己一个问题:样本的含义
如果用很多不同的样本估计同样的系数,估计值的变化会有多大?能度量这个变化性的统计量就是标准误。
如果标准误差太大(这个大当然是相对于系数的值,也和样本容量有关),考虑到我们真正感兴趣的是整体情况,刚才用这个样本估计的系数没有参考价值,这个系数不显著。
毕竟,我们手中只有一个样本,它只有一个平均值。如何计算总体方差和总体标准差?下面将解释的计算方法实际上表示潜在的变化。
抽样方差与整体方差的关系
显然,Y它们与这两个随机变量密切相关,各自的整体方差,即Y总体方差与抽样方差有关:
其中n相应的样本容量。推导过程已经省略,但请注意,推导过程中隐含了一个假设,即整体是无限的(所以如果样本容量和整体一样大怎么办)。现实中,人们更喜欢用两边的算术平方根,即:
其中SE即为“StandardError缩写,直译是标准误。为什么叫误?(error)怎么样?可以简单地理解:标准误差是总体标准差。如果标准差越大,分布就越离散。我们用它来估计Y当总体平均值时,误差可能越大。直观地说,样本容量n当它接近无限大时,根据大数定律,它将接近Y如果总体平均值,则标准误差应接近0。显然,计算公式告诉我们结果是这样的。
正如我之前所说,现实中很难获得总体标准差异,所以我们将用它来取代上述公式:
当然,这里的样本标准差是总体标准差的估计,分母是计算时的,而不是根号。
1)人们把关于总体的统计量叫做“总体XX(populationxxx)将样本的统计量称为样本XX(samplexxx)”。
2)为了使样本方差成为整体方差的无偏估计量,计算样本方差时的分母不是样本容量n而是n-1。但如果你只是想研究样本中数据的离散程度,分母不需要减少1。
3)因为每次抽样都能得到样本平均值,所以也是随机变量。这种新随机变量的总体方差称为抽样方差(samplingvariance)新随机变量的总体标准差称为标准误差(standarderror)。抽样方差和标准误义在现实中可能更丰富,但都与抽样有关(sampling)相关。找到40386826个原始样本的含义设计图片,包括样本的含义图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《样本的含义(总体、样本、总方差、样本方差、抽样方差和标准误差差)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177579.html