为什么30个样本被称为「大样本」,而不是40或50?
前面有人说:为什么样本不能低于:30
若小概率事件为0.05,那么30个样本肯定会出现一次。按照两项分布的规律,如果一般抽30个样本,小概率事件的概率可以画出来33.89%。不一定会出现。
此外,严广伟贴的书中有一段样本容量小于30时,不能使用Z检查。严格来说,在95%的信心要求下,样本容量小于30不能进行Z但是可以用t检查。因为假设检查通常是在95%的前提下进行的,所以这个前提的内容在书中被省略了。
样本数的决定取决于预测的精度。简单理解预测精度就是能容忍的差异,可以表现为标准偏差或百分比差。也就是说▏μ-M▏允许差多少。μ整体均值,M抽样获得的平均值。差异越小,抽样数越多。
若允许10%的预测误差,则为▏μ-M▏/μ这通常被认为是一种稳定的状态。也就是说,最大误差不能超过0.1整体偏差倍。总偏差的宽度是6个标准偏差,那么允许的误差就应该是五分之三标准偏差。按照这样的精度要求计算,样本数是30。所以,30个样本数就是这样产生的。
在计算技术不发达的初期,统计学家制定了这样一个计划,以使普通人能够使用统计技术。
有以下公式计算如何计算样本数,α=0.05、β=0.1。感兴趣的可以算一下。
实际上需要多少样本数来反映整体?
例如,为什么样本不能低于30
扔硬币,有人问过这样一个问题,就是扔10次都是正面的,那么第11次是正面的概率是多少?扔硬币的时候,确实会有一个连续的一面,但这不是它的本质概率。要想获得准确的本质概率,需要扔多少次才能反映?扔11次,得出某一面50%结论的概率只有70%。如果要达到99%的准确性,需要测试9604次。因此,样本需要多少完全取决于预测的准确性。
上表是样本数量的计算表,E它代表了我们能忍受的错误。历史上很多人都做过抛硬币试验,结果证实了上述计算结果。
如何确定样本量有很多基本方法,但公式检验表明,当误差和信心范围确定时,不同样本量计算公式计算的样本量非常相似。因此,我们可以使用简单的随机抽样公式来近似估计其他抽样方法的样本量,这样可以更快更方便,然后按照一定的方法将样本量分配到每个子域.因此,区域二相抽样不能计算样本量是不科学的.
1简单随机抽样确定样本量主要有两种类型:
(1)平均类型的变量
我们通常根据以下步骤计算已知数据的绝对数量.已知预期调查结果的准确性(E),期望调查结果的置信度(L),以及总体标准差估计值σ具体数据,总单位数N.
计算公式为:n=σ2/(e2/Z2 σ2/N)
在特殊情况下,如果是一般的,计算公式变为:n=Z2σ2/e2
比如平均收入误差在正负人民币30元之间,调查结果在95%的信心范围内,95%的信心要求Z的统计量为1.96.估计总标准差为150元,总单位数为1000.
样本量:n=150*150/(30*30/(1.96*1.96)) 150*150/1000)=88
(2)百分比类型的变量
已知数据为百分比,样本量一般按以下步骤计算.已知调查结果的精度值百分比(E),以及置信度(L),比例估计(P)精度,即样本变异程度,总数为N.
计算公式为:n=P(1-P)/(e2/Z2 P(1-P)/N)
同样,如果在特殊情况下不考虑总体情况,公式为:n=Z2P(1-P)/e2
一般来说,我们不知道P的取值,取样本变异程度最大的值0.5.
例如,希望平均收入的误差在于正负0.05调查结果在95%的信心范围内,95%的信心要求Z的统计量为1.96,估计P为0.5,单位总数为1000.样本量为:n=0.5*0.5/(0.05*0.05/(1.96*1.96) 0.5*0.5/1000)=278
2.样本量分配方法
通过以上分析,我们获得了采用简单随机抽样公式计算的样本量,总样本量需要乘以设计效果的值.由于样本总量已确定,我们采用总样本量固定法分配样本,包括按比例分配和不按比例分配.在实际工作中,首先计算区县总样本量,然后逐级分配到各级。如果不知道各级的规模和方差,一般采用比例分配或比例方根分配法.若有一定的辅助变量可使用,样本量可按规模分配法分配.
3.样本量与整体尺寸的关系:在其他条件下,即误差、信誉、抽样比,样本量随整体尺寸而变化.但是,总体变化越大,变化越不明显;总体变化较小,变化明显.
两者之间的变化不是线性关系.所以,样本量并不是越大越好,应该综合考虑,实际工作中只要达到要求就可以了.
为什么样本不能低于结论:30
样本尺寸与预期的预测精度和总体尺寸有关。预测精度越高,样本量越大。直到100%的调查。
为了保证95%的信誉,我们通常认为至少30组数据是抽样调查的样本数。如果一组有5个数据,一般按125执行。当总数小于3000时,我们基本上可以按照125个样本数执行。找出为什么61326531个原创样本不低于30张设计图片,包括为什么样本不低于30张图片、材料、海报、证书背景和源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《为什么样本不能低于30(为什么 30 样本被称为「大样本」)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/180750.html