如何在假设检验中确定样本量?
有趣的灵魂 高级Analyst=爱吃的我
为什么要确定样本量来确定样本量的步骤(Python)1.为什么要确定样本容量
1)事后检查和事前检查
做完一个假设检验之后,如果结果具有统计显着性,那么还需要继续计算其效应量;如果结果不具有统计显着性,并且还需要继续进行决策的话,那么需要计算功效。假设检验之后计算出的功效或效应量不理想,我们也没有办法改变。
在进行假设测试之前,提前确定我们想要达到的效果和效果,然后根据显著程度α,计算样本容量的功效和效应量n,这种应用要广泛得多。
2)效应量(effectsize):如何确定样本量
样本之间的差异或相关程度的量化指标。
通常用三种方式来衡量效应量:如何确定样本量
(1)标准均差(standardizedmeandifference)
(2)几率(oddratio)
(3)相关系数(correlationcoefficient)。
3)功效(power):如何确定样本量
正确拒绝原假设的概率,记录1-β。
假设检验的效果受以下三个因素的影响:
(1)样本量(n):其它条件保持不变,样本量越大,效果越大。
(2)显著水平(α):其它条件保持不变,显著程度越低,效果越小。
(3)两个整体之间的差异:其他条件保持不变,总参数的真实值和估计值之间的差异越大,效果就越大。也可以说,效应量(effectsize)效果越大,效果越大。
4)样本量大小的影响
如果样本量太小,你可能会包含大量的异常点和离群点,这种偏差结果不能给你一个合理的整体评估。
如果样本量太大,整个学习过程将变得非常复杂和耗时。即使结果更准确,也不值得花更多的钱。
2.确定样本量的步骤
S1.考虑样品量变量
在计算你的样本量之前,你必须确定你的目标总体和准确性的变量。
1)总体大小
你的目标群体是谁?你的目标群体有多少?如果不知道准确的数字,可以用未知数来估计一个范围。
2)误差幅度(置信间隔)
错误是不可避免的,问题是我们会允许多少错误。误差范围,即信心范围,用平均值表示。
我们可以设置样本平均数和人口平均数之间的差异。比如有时候听新闻,会有68%的选民提案Z表示赞成,误差幅度为 //-5%。这是一个置信区间。
3)置信度
这一变量反映了我们对这一估计的信心,使实际平均值陷入误差。最常见的信心范围是90%、95%和99%。
4)标准偏差
这一步要求我们估计收到的响应(response)平均值之间的差异。低标准偏差意味着所有值都将围绕平均值进行聚类,而高标准偏差意味着它们将分散在非常小和非常大的外围数字范围内。由于没有调查,安全的选择是0.5标准偏差将有助于确保样本量足够大。
S2.计算样本量
1)找到Z分数
转换我们之前设置的信心度Z分数,即:
90%–ZScore=1.645
95%–ZScore=1.96
99%–ZScore=2.576
2)使用样本量公式
样本量大小=[(Z分数^2)*标准偏差*(1-标准偏差^2)
3.相关代码(Python)
单样本t检验:
statsmodels.stats.power.tt_solve_power(effect_size=None,nobs=None,alpha=None,power=None,alternative='two-sided')
独立样本t检验:
statsmodels.stats.power.tt_ind_solve_power(effect_size=None,nobs1=None,alpha=None,power=None,ratio=1.0,alternative='two-sided')
卡方拟合优度检验:
statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=None,nobs=None,alpha=None,power=None,n_bins=2)
F方差齐性检验:
statsmodels.stats.power.FTestPower.solve_power(effect_size=None,df_num=None,df_denom=None,nobs=None,alpha=None,power=None,ncc=1)
方差分析:
statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=None,nobs=None,alpha=None,power=None,k_groups=2)
可见,用Statsmodels库计算效果、效应量和样本量的函数相同,只要需要计算的值仍然设置为None,填写你想要达到的其他值。
References:找到44633235张原创设计图片,包括如何确定图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《如何确定样本量(如何在假设检验中确定样本量)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177813.html