1.统计效果和关键概念2.Z确定检验样本量2.1推导统计功效公式2.2样本量计算公式2.3样本量3.卡方确定检验样本量3.1样本量4.简要总结Reference在数据分析过程中,一个完整的闭环是从数据中获得洞察力,根据洞察力获得某种假设,并通过实验检验。
AB实验实际上是在做一个假设测试,可以参考最后一个笔记,在检查数据的过程中,主要有两种测试方法(不同的样本量,不同的测试方法)——
Z检验,即检验实验组和对照组是否服从平均分布,即检验实验组是否服从理论分布(视为理论分布)Z以检验为例,介绍如何确定AB实验组和对照组的样本量提供相应的代码,卡方检验原理相似。
假设检验中有以下两种错误——
弃真:样本量在统计中确定公式
原来的假设是真的,我们拒绝原来的假设,这种错误被称为一种错误:样本量确定公式的统计
原来的假设是假的,我们接受原来的假设。这种错误称为二型错误。在教科书中,它通常仅限于显著的水平,即只考虑一型错误的概率,而不考虑二型错误。但在实际应用中(如AB实验),二型错误也必须限制在较低的范围内。在这种情况下,即使足够小,实验结果也不够令人信服。
假设实验的显著性和二型错误概率意味着,如果原假设是真的,我们判断错误(即拒绝)的概率为1%;如果原假设是假的,我们判断错误(即接受)的概率为50%。
考虑上述二型错误,更常见的是考虑统计效果。
统计效果是指当原假设为假时,拒绝原假设的概率。所以有。
统计效果与统计效果的关系类型可以通过统计效果获得。另一方面,所需的样本量可以在知道后找到。
原假设和备选假设如下:统计中样本量确定公式
根据二型错误的概念,假设有
注意,由于是假的,即不服从正态分布,需要转化为服从标准正态分布。
有统计效果与二型错误的关系
这样就获得了统计效果power表达式。以上推导出了统计效果的计算公式。当然,有许多工具可以计算样本量。例如,该工具还提供计算公式,类似于上述推导。注意区别在于该工具的下分位点,上述推导为上分位点。
样本量的计算公式也可以从本网站的公式中看到。
python假设检设检验的函数(R也有类似的函数,参考),Z检验函数的定义如下。使用时提供参数,留下未知参数(None),返回值是未知参数的计算结果,见下面的具体例子。
第一个参数表示效应量,代表不同处理下的整体差异(即判断是否有差异,以及差异)。Z近似效应量可用于检验中确定样本量。
假设原方案的留存率为0.40,预计新方案的保留率为0.45,方差为1,则样本量如下:
使用python第一组6280人,第二组等于第一组(ratio=1)按公式计算,两个Z根据值检查表,代入公式,样本量为6280,与上述一致,结果为6267,与上述计算结果相差不大,猜测效应量公式不同。计算结果相同,6280卡检验的推导思路应与Z检查大致相同。我没有试过。它直接在这里使用python与工具对比函数。
python使用方法和提供的卡方检验函数如下Z检验函数相同。
四格表的效应量计算公式如下():
使用python函数计算,样本量为3068,每组1534使用结果如下,每组样本量为1514,使用结果与上述函数结果差异较小,每组样本量为1514两个工具为1514,因效应量计算方法不同,猜测结果不同。
因为没有实际进行AB实验不清楚实际应用中使用的方法。个人认为卡方检验更方便实用。一方面样本量少,实验成本低,另一方面参数少(不需要提供方差)。
以上是我的AB如果有错误,请纠正实验样本量计算的一些思路~
接触一些实验案例,补充一些确定最小样本量的知识点。
1、获得最小样本量后,如何检验实验效果?
答:获得最小样本量的不同公式有相应的检验方法,如Z检验、T使用的公式应与后续的试验效果一致。
2、用最小样本量做实验后,检验的结果表示什么?是否可信?
答:确定最小样本量时,会指定显著程度(,一型错误的概率,如5%)和统计效果(,二型错误的概率,如20%)。
一般原假设如下:AB两组实验指标是否有差异。实验结果根据最小样本量表示:
若AB这两组指标没有差异,但我们认为差异(一型错误,弃真)的概率是5%AB这两组指标有差异,但我们认为没有差异(二型错误,伪造)的概率是20%(以上两种概率的选择也反映了AB一些实验理念,宁愿砍掉4个好产品,也不愿让1个坏产品上线。
3、在确定最小样本量时,需要指定实验指标的值,如保留率,对照组为30%,实验组为35%,这是什么意思?
答:在相同的犯错概率下,当AB组的差异越大,检验差异所需的样本量就越小从公式中可以看到)。最小样本量表示:
当AB当两组之间存在如此大的差异时,我们犯错误的概率足够低(即我们指定的显著水平和统计效果),即我们有足够的概率检测差异。但请注意,一旦检测到差异,差异是5%AB当两组没有那么大的区别时,我们犯错误的概率就会增加,我们的判断也就不足以相信了。例如,在设置保留率提高5个百分点后,获得最小样本量进行实验,但实际上实验组只比对照组提高2个百分点。此时,由于样本量不足,可能无法拒绝【AB这两组没有区别这个原始假设,也就是说,我们没有检验到差异。因此,在设置指标时,应根据业务情况确定,并将其设置为有意义的业务改进下限。例如,例如,可能认为至少提高5点是有意义的,提高2点是没有意义的,然后设置为提高5点,两点之间的差异是否被测试并不重要。
《浙江大学毕业证概率论与数学统计第四版》在14297121个原始统计中找到样本量确定公式设计图片,包括样本量确定公式图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《样本量确定公式(概率论- (3)AB确定实验样本量)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177697.html