为什么样本不能低于30(为什么 30 样本被称为「大样本」)

摘要:本文解释了为什么样本数通常设定为至少30个,涉及预测精度、统计规律、样本容量与预测误差的关系等方面。文章指出,样本数的决定取决于预测的精度,小概率事件在30个样本中不一定发生,而样本容量小于30时仍可使用t检查。为了获得准确的本质概率,需要足够的样本数。文章还介绍了样本量的计算方法和分配方式,强调了样本量与总体尺寸的关系,并指出样本量并非越大越好。总体上,样本尺寸与预期的预测精度和总体尺寸有关,为了保证一定的预测精度和置信度,通常认为至少需要30个样本数。

为什么30个样本被称为「大样本」,而不是40或50?

前面有人说:为什么样本不能低于:30

为什么样本不能低于30(为什么 30 样本被称为「大样本」)

若小概率事件为0.05,那么30个样本肯定会出现一次。按照两项分布的规律,如果一般抽30个样本,小概率事件的概率可以画出来33.89%。不一定会出现。

此外,严广伟贴的书中有一段样本容量小于30时,不能使用Z检查。严格来说,在95%的信心要求下,样本容量小于30不能进行Z但是可以用t检查。因为假设检查通常是在95%的前提下进行的,所以这个前提的内容在书中被省略了。

样本数的决定取决于预测的精度。简单理解预测精度就是能容忍的差异,可以表现为标准偏差或百分比差。也就是说▏μ-M▏允许差多少。μ整体均值,M抽样获得的平均值。差异越小,抽样数越多。

若允许10%的预测误差,则为▏μ-M▏/μ这通常被认为是一种稳定的状态。也就是说,最大误差不能超过0.1整体偏差倍。总偏差的宽度是6个标准偏差,那么允许的误差就应该是五分之三标准偏差。按照这样的精度要求计算,样本数是30。所以,30个样本数就是这样产生的。

在计算技术不发达的初期,统计学家制定了这样一个计划,以使普通人能够使用统计技术。

有以下公式计算如何计算样本数,α=0.05、β=0.1。感兴趣的可以算一下。

实际上需要多少样本数来反映整体?

例如,为什么样本不能低于30

扔硬币,有人问过这样一个问题,就是扔10次都是正面的,那么第11次是正面的概率是多少?扔硬币的时候,确实会有一个连续的一面,但这不是它的本质概率。要想获得准确的本质概率,需要扔多少次才能反映?扔11次,得出某一面50%结论的概率只有70%。如果要达到99%的准确性,需要测试9604次。因此,样本需要多少完全取决于预测的准确性。

上表是样本数量的计算表,E它代表了我们能忍受的错误。历史上很多人都做过抛硬币试验,结果证实了上述计算结果。

如何确定样本量有很多基本方法,但公式检验表明,当误差和信心范围确定时,不同样本量计算公式计算的样本量非常相似。因此,我们可以使用简单的随机抽样公式来近似估计其他抽样方法的样本量,这样可以更快更方便,然后按照一定的方法将样本量分配到每个子域.因此,区域二相抽样不能计算样本量是不科学的.

1简单随机抽样确定样本量主要有两种类型:

(1)平均类型的变量

我们通常根据以下步骤计算已知数据的绝对数量.已知预期调查结果的准确性(E),期望调查结果的置信度(L),以及总体标准差估计值σ具体数据,总单位数N.

计算公式为:n=σ2/(e2/Z2 σ2/N)

在特殊情况下,如果是一般的,计算公式变为:n=Z2σ2/e2

比如平均收入误差在正负人民币30元之间,调查结果在95%的信心范围内,95%的信心要求Z的统计量为1.96.估计总标准差为150元,总单位数为1000.

样本量:n=150*150/(30*30/(1.96*1.96)) 150*150/1000)=88

(2)百分比类型的变量

已知数据为百分比,样本量一般按以下步骤计算.已知调查结果的精度值百分比(E),以及置信度(L),比例估计(P)精度,即样本变异程度,总数为N.

计算公式为:n=P(1-P)/(e2/Z2 P(1-P)/N)

同样,如果在特殊情况下不考虑总体情况,公式为:n=Z2P(1-P)/e2

一般来说,我们不知道P的取值,取样本变异程度最大的值0.5.

例如,希望平均收入的误差在于正负0.05调查结果在95%的信心范围内,95%的信心要求Z的统计量为1.96,估计P为0.5,单位总数为1000.样本量为:n=0.5*0.5/(0.05*0.05/(1.96*1.96) 0.5*0.5/1000)=278

2.样本量分配方法

通过以上分析,我们获得了采用简单随机抽样公式计算的样本量,总样本量需要乘以设计效果的值.由于样本总量已确定,我们采用总样本量固定法分配样本,包括按比例分配和不按比例分配.在实际工作中,首先计算区县总样本量,然后逐级分配到各级。如果不知道各级的规模和方差,一般采用比例分配或比例方根分配法.若有一定的辅助变量可使用,样本量可按规模分配法分配.

3.样本量与整体尺寸的关系:在其他条件下,即误差、信誉、抽样比,样本量随整体尺寸而变化.但是,总体变化越大,变化越不明显;总体变化较小,变化明显.

两者之间的变化不是线性关系.所以,样本量并不是越大越好,应该综合考虑,实际工作中只要达到要求就可以了.

为什么样本不能低于结论:30

样本尺寸与预期的预测精度和总体尺寸有关。预测精度越高,样本量越大。直到100%的调查。

为了保证95%的信誉,我们通常认为至少30组数据是抽样调查的样本数。如果一组有5个数据,一般按125执行。当总数小于3000时,我们基本上可以按照125个样本数执行。找出为什么61326531个原创样本不低于30张设计图片,包括为什么样本不低于30张图片、材料、海报、证书背景和源文件PSD、PNG、JPG、AI、CDR等格式素材!

毕业证样本网创作《为什么样本不能低于30(为什么 30 样本被称为「大样本」)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/180750.html

(0)
上一篇 2022年4月29日
下一篇 2022年4月29日

相关推荐

  • 统计学中的总体和样本是什么(推理统计学:理解总体和样本)

    摘要:

    本文介绍了统计学中的总体和样本概念,并阐述了描述统计和推理统计的区别。总体指的是具有同质性的大量单位集合,样本则是从总体中提取的部分单位集合。本文还讨论了样本的特性,如同质性、大量性和差异性,并介绍了样本在统计推断中的作用。此外,文章提到了描述统计和推断统计的区别和联系,以及抽样方法和大小的重要性。最后,文章提供了一些相关素材资源的推荐。通过本文的学习,读者可以更好地理解统计学中的基本概念和方法,为深入学习和应用统计学打下基础。

    2022年4月30日
    260
  • 样本概念(总体与样本)

    摘要:本文介绍了样本和总体的概念,包括样本数量、样本大小、标准误差等。文章还阐述了中心极限定理,用样本来估计整体,无论整体分布如何,样本平均值都会围绕整体平均值呈正态分布。此外,文章探讨了如何用样本估计总体标准差,并介绍了样本偏差、幸存者偏差、概率偏见和信息茧房等概念及其典型问题。

    2022年4月30日
    230
  • 什么是数理统计中的样本(数理统计第一讲(数理统计介绍及基本概念)

    摘要:

    本文介绍了数理统计的基本概念,包括整体与样本的定义、性质及其区别。强调数理统计是一门兼具科学和艺术的学科,涉及收集和分析具有随机影响的数据。文章详细阐述了数学统计学的研究对象、目的以及统计方法的运用。同时,探讨了数理统计中的样本抽取方法,特别是简单随机抽样的性质和特点。文章还提到了数学统计作为大二专业课程的内容以及与其他数据处理学科的区别。最后,文章强调了大数据时代下统计学的重要性,并指出统计学在解决实际问题中的广泛应用。

    2022年4月30日
    260
  • 统计学中个人样本的一般例子(统计概率)--一般和样本)

    摘要:本文主要介绍了统计概率中的总体与样本概念,包括抽样分布、抽样方法、中心极限定理等。文章阐述了如何利用样本估计整体情况,并强调了正确抽样方法的重要性。同时,文章还提到了避免样本偏差、幸存者偏差、概率偏见和信息茧房等问题的方法和注意事项。

    2022年4月29日
    230
  • 居民调查样本轮换宣传口号(CK12-Statistics 1 -Interval Estimates)

    摘要:文章探讨了关于电气工程师中的统计内容,介绍了期望值与收益的概念。通过具体例子(支付停车费和罚款风险)展示了期望值计算方法,引出标准误的理解和应用,描述了置信区间和抽样分布的关系。同时,探讨了误差范围和整体平均值估计的概念,并解释了如何在具体的情境下应用这些概念,如糖果包装中的樱桃比例问题。此外,文章还涉及了样本轮换宣传口号设计素材的相关信息。

    2022年4月29日
    240
客服微信
客服微信
返回顶部