如何确定样本量(如何在假设检验中确定样本量)

摘要:本文介绍了在假设检验中确定样本量的重要性,并详细阐述了确定样本量的步骤。文章提到了效应量和功效的计算,并解释了样本量对假设检验的影响。同时,本文还提供了使用Python的Statsmodels库来计算样本量的相关代码。正确确定样本量对于保证假设检验的有效性和准确性至关重要。

如何在假设检验中确定样本量

有趣的灵魂 高级Analyst=爱吃的我

如何确定样本量(如何在假设检验中确定样本量)

为什么要确定样本量来确定样本量的步骤(Python)1.为什么要确定样本容量

1)事后检查和事前检查

做完一个假设检验之后,如果结果具有统计显着性,那么还需要继续计算其效应量;如果结果不具有统计显着性,并且还需要继续进行决策的话,那么需要计算功效。假设检验之后计算出的功效或效应量不理想,我们也没有办法改变。

在进行假设测试之前,提前确定我们想要达到的效果和效果,然后根据显著程度α,计算样本容量的功效和效应量n,这种应用要广泛得多。

2)效应量(effectsize):如何确定样本量

样本之间的差异或相关程度的量化指标。

通常用三种方式来衡量效应量:如何确定样本量

(1)标准均差(standardizedmeandifference)

(2)几率(oddratio)

(3)相关系数(correlationcoefficient)。

3)功效(power):如何确定样本量

正确拒绝原假设的概率,记录1-β。

假设检验的效果受以下三个因素的影响:

(1)样本量(n):其它条件保持不变,样本量越大,效果越大。

(2)显著水平(α):其它条件保持不变,显著程度越低,效果越小。

(3)两个整体之间的差异:其他条件保持不变,总参数的真实值和估计值之间的差异越大,效果就越大。也可以说,效应量(effectsize)效果越大,效果越大。

4)样本量大小的影响

如果样本量太小,你可能会包含大量的异常点和离群点,这种偏差结果不能给你一个合理的整体评估。

如果样本量太大,整个学习过程将变得非常复杂和耗时。即使结果更准确,也不值得花更多的钱。

2.确定样本量的步骤

S1.考虑样品量变量

在计算你的样本量之前,你必须确定你的目标总体和准确性的变量。

1)总体大小

你的目标群体是谁?你的目标群体有多少?如果不知道准确的数字,可以用未知数来估计一个范围。

2)误差幅度(置信间隔)

错误是不可避免的,问题是我们会允许多少错误。误差范围,即信心范围,用平均值表示。

我们可以设置样本平均数和人口平均数之间的差异。比如有时候听新闻,会有68%的选民提案Z表示赞成,误差幅度为 //-5%。这是一个置信区间。

3)置信度

这一变量反映了我们对这一估计的信心,使实际平均值陷入误差。最常见的信心范围是90%、95%和99%。

4)标准偏差

这一步要求我们估计收到的响应(response)平均值之间的差异。低标准偏差意味着所有值都将围绕平均值进行聚类,而高标准偏差意味着它们将分散在非常小和非常大的外围数字范围内。由于没有调查,安全的选择是0.5标准偏差将有助于确保样本量足够大。

S2.计算样本量

1)找到Z分数

转换我们之前设置的信心度Z分数,即:

90%–ZScore=1.645

95%–ZScore=1.96

99%–ZScore=2.576

2)使用样本量公式

样本量大小=[(Z分数^2)*标准偏差*(1-标准偏差^2)

3.相关代码(Python)

单样本t检验:

statsmodels.stats.power.tt_solve_power(effect_size=None,nobs=None,alpha=None,power=None,alternative='two-sided')

独立样本t检验:

statsmodels.stats.power.tt_ind_solve_power(effect_size=None,nobs1=None,alpha=None,power=None,ratio=1.0,alternative='two-sided')

卡方拟合优度检验:

statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=None,nobs=None,alpha=None,power=None,n_bins=2)

F方差齐性检验:

statsmodels.stats.power.FTestPower.solve_power(effect_size=None,df_num=None,df_denom=None,nobs=None,alpha=None,power=None,ncc=1)

方差分析:

statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=None,nobs=None,alpha=None,power=None,k_groups=2)

可见,用Statsmodels库计算效果、效应量和样本量的函数相同,只要需要计算的值仍然设置为None,填写你想要达到的其他值。

References:找到44633235张原创设计图片,包括如何确定图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!

毕业证样本网创作《如何确定样本量(如何在假设检验中确定样本量)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177813.html

(0)
上一篇 2022年4月28日
下一篇 2022年4月28日

相关推荐

  • 中级会计职称报名条件(工作年限如何确定)

    摘要:
    中级会计师报名人数持续增长,各地区财政部门发布报名数据,显示初级报名人数也呈上升趋势。中级证书的重要性和市场需求日益增加,各地区也推出中级证书福利制度。建议考生尽早通过考试,争取大量学习时间,积极学习,学会依靠外力,应用相应的课程培训和书籍来提高学习效率。

    2022年4月21日
    230
  • 统计样本量(如何在问卷研究中确定样本量)

    摘要:确定问卷研究的样本量需考虑统计样本容量的代表性、样本量、调查方法、统计模型、问卷设计等因素。识别合适的研究对象重要于样本大小,样本量越大结果越可靠,但成本也随之增加。需要考虑分析的子组数量、调查方法的发生率和响应率。风铃系统提供自有样本库,可根据用户需求进行精准抽样,同时提供样本服务,降低调查成本,提高用户粘性和合作程度。

    2022年4月30日
    240
  • 如何确定抽样调查的样本量(抽样调查第05讲(分层抽样)

    摘要:
    本文主要讨论了分层抽样中样本量的确定问题,包括各层样本量的分配、总样本量的确定、抽样效果分析。文中介绍了常数分配、与各层方差成比例、与各层总量成比例等分配思路。在样本量分配的原则下,讨论了估计量的性质。此外,还涉及了分层抽样平均值的简单估计、样本量足够层的处理、样本量不足层的再次提取等问题。同时,文章还探讨了如何优化成本和方差,使估计量的方差最小化。最后,文章介绍了不同情况下样本量的确定方法,包括使用柯西施瓦兹不等式、拉格朗日乘数法、内曼分配等。总体而言,文章主要介绍了分层抽样中样本量的确定方法和相关理论,对于分层抽样的实施具有一定的指导意义。

    2022年4月28日
    230
  • 如何确定问卷调查样本量(如何确定问卷调查中合适的样本量?

    摘要:本文探讨了在进行问卷调查时如何确定合适的样本数量。文章指出,确定样本量需要考虑研究目的、统计模型、问卷设计、调查方法、统计误差等因素。此外,还需要考虑成本、调查方法的响应率和发生率。文章以风铃系统为例,介绍了其在样本选择、问卷回收和奖励机制等方面的做法,并强调样本量设计需结合实际情况进行灵活调整。文章还涉及了样本量设计在图片素材等领域的应用。

    2022年4月28日
    270
  • 如何确定样本量(如何在假设检验中确定样本量)

    摘要:本文介绍了在假设检验中确定样本量的重要性,并详细阐述了确定样本量的步骤。文章提到了效应量和功效的计算,并解释了样本量对假设检验的影响。同时,本文还提供了使用Python的Statsmodels库来计算样本量的相关代码。正确确定样本量对于保证假设检验的有效性和准确性至关重要。

    2022年4月28日 上午8:18
    240
客服微信
客服微信
返回顶部