计算统计中最小样本量
这一篇我们讲讲计算统计中最小样本量。大家先想想为什么叫最小样本量,而不是最大或者直接叫样本量计算呢?
这是因为最小样本量的概念主要用于抽样统计。为了研究某件事的情况,抽样统计从整体上提取一些样本进行研究,并用提取的样本取代整体情况。例如,如果你想研究中学毕业生的平均身高,你不太可能再次测量全国中学毕业生的身高,然后找到一个平均值。更简单的方法是从全国中学毕业生中提取一部分,然后用这部分学生的平均身高取代全国中学毕业生的平均身高。
由于抽样样本的平均身高取代了整体平均身高,我们需要考虑一个问题,即抽样样本是否可以代表整体。假设全国有1000万中学毕业生,你只选择了100名学生。用这100名学生的平均身高取代这1000万学生的平均身高显然是不合理的。那么,我们应该至少选择多少样本来代表整体呢?至少样本是最小样本量,这意味着至少需要这么多样本量。当然,它也可以比这更多。样本越多,结果就越具代表性。然而,由于实际上很难获得尽可能多的样本,为了确保样本结果足够具有代表性,我们通常选择最小样本量。如何确定最小样本量?这是我们本文的重点。
在谈论最小样本量之前,让我们谈谈另一个概念,统计效果,即power值。这也是前一篇文章中提到的,我们再提一遍。
假设检验中计算的P小于或等于显性水平α,则拒绝零假设,否则接受原假设。在这个决策的过程中容易犯两种错误:小样本统计方法
第一类错误(I类型错误)被称为弃真错误。流行的是漏诊,就是生病了(假设是正确的),但是你没有检测到,所以拒绝了;第二种错误(II类型错误)是一个伪错误。一般来说,它是误诊,即没有疾病(假设是错误的)。结果,你诊断你生病了(假设是正确的),所以你接受了假设。
需要注意的是,不同检验满足的分布不同,相应power公式不同,最小样本量公式也从power因此,不同检验方法对应的最小样本量公式也不同。本文旨在满足正态分布Z检验为例。
毕业证样本网创作《样本统计方法(统计中最小样本量计算)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/183514.html