假设检验:独立样本与相关样本的区别
单样本、相关样本、独立样本T检查案例分析
T小样本(样本容量小于30)用于两个平均值差异的检验方法。它是用来的T分布理论推断了差异的概率,以确定两个平均值之间的差异是否显著。本文将通过三个案例进行分析T三种检验类型:独立样本与相关样本的区别
1.汽车发动机-单样本检验分析
2.斯特鲁普效应-相关配对检验分析
3.A/B独立双样本检验
超级发动机是一家专门生产汽车发动机的公司。根据政府发布的新排放要求,发动机平均排放值低于20ppm,(ppm这是英语百万分之一的缩写。在这里,我们只需要理解汽车尾气中的碳氢化合物低于环保要求20ppm)。
公司生产10台发动机供测试,每台排放水平如下:独立样本与相关样本的区别
15.616.222.520.516.419.416.617.912.713.9
如何知道公司生产的引擎是否符合政府规定?
如果你是这家公司的数据分析师,你该怎么办?
先对平均值(集中趋势)、标准差(变异性)等数据进行描述性统计分析。
推论性统计分析报告包括:假设检验、信心范围、效应量
零假设和备选假设
H0(零假设):零假设公司生产的引擎不能满足政府规定的新排放标准,即平均值μ>=20。
H1(备选假设):公司生产的引擎可以满足政府规定的新排放标准,即平均值μ<20。
抽样分布类型
在这种情况下,样本大小为10(小于30),属于小样本。我们必须使用它t检查需要满足样本的整体正态分布。因此,我们需要拟合样本数据的频率分布,看看它是否符合近似正态分布的条件(使用它seaborn查看数据集的分布图,确定分布类型)。
通过观察上述数据集察上述数据集分布图来使用t检验。
备选假设公司的引擎排放符合新排放标准,即平均值μ所以我们用单尾假设(左尾)。
确定临界区位置(判断标准)
计算检验统计
1)计算标准误差
2)计算t值
1.描述统计分析
平均样本值为17.17ppm,样品标准差为2.98ppm
2.推论统计分析
1)假设检验
独立样本t(df=9)=-3.00,p=0.0075(α=5%)单位检查(左尾)
公司发动机排放符合新标准
2)置信区间
样本平均值的置信区间,95%CI=(15.44,18.90)
3)效应量
d=-0.95
R2=0.50
斯特鲁普效应:
试着说出上下两组单词的颜色。阅读第一组单词的颜色非常容易和快速,而阅读第二组单词的颜色则不那么容易。阅读时间明显慢得多。这就是著名的斯特鲁普效应。
斯特鲁普效应:心理学中指对非优势反应(答案字的含义)的干扰。简单来说,斯特鲁普效应是人们在出现与原始认知不同的情况时,反应时间会更长。
接下来,我们将验证斯特普鲁效应。
通过网上的stroop实验测试了人们的反应时间。每个参与者得到两组彩色文本。第一组数据是字体内容与字体颜色一致,第二组数据是字体内容与字体颜色不一致。每个参与者告诉每组文本的颜色,并计算每个参与系统完成每组的时间。
用柱状图比较两个样本数据
H0(零假设):人的反应时间不会因为字体内容和字体颜色是一样的(u1=u2,或者u1-u2=0)
H1(备选假设):特鲁普效应确实存在。根据特鲁普效应的定义,当颜色和文字不同时,人们的测试时间会更长(u1 由于两组数据来自相同的样本,因此选择相关的配对检查。 相关配对检查只关注每对相关数据的差异,以避免参与者反应时间个体差异的影响。在只关注差异集的情况下,样本集处理后只有一组(差异集)。让我们处理样本数据集。 在这种情况下,样本大小为24(小于30),属于小样本。我们必须使用它t检查需要满足样本的整体正态分布。因此,我们需要拟合样本数据的频率分布,看看它是否符合近似正态分布的条件(使用它seaborn查看数据集的分布图,确定分布类型)。 通过观察上述差值数据分布图,数据集类似于正态分布,以满足需求t对于分布的使用条件,我们可以使用相关样本t检验。 根据备选假设,特鲁普效应确实存在StroopEffect当颜色和文字不同时,人们的完成测试时间会变长(u1 因此,我们在单尾检查中使用左尾检查,显著水平为5%,t检查的自由度df=n-1=24-1=23 第一组样本数据:当字体内容与字体颜色一致时,平均反应时间为:13.93秒,标准差是3.54秒 第二组样本数据:当字体内容与字体颜色不一致时,平均反应时间为:22.35秒,标准差是5.01秒 独立样本t(df=23)=-8.09,p=1.77e-08(α=5%)单位检查(左尾) 斯特鲁普效应存在明显的统计差异,拒绝零假设。 样本平均值的信心范围为95%CI=(-10.61,-6.64) d=-1.65 R2=0.88 A/B测试:简单来说,就是为同一个目标制定两个方案(比如两个手机键盘界面),让一些用户使用A另一部分用户使用方案B记录用户的使用情况,看哪个方案更符合设计。可以看出AB测试对于产品优化有很大的帮助 案例介绍:有两款手机键盘布局不同(A版本,B版本),作为公司的产品经理,你想知道哪个键盘布局对用户体验更好,才能正式发布产品。 我们将测量标准定为用户打字时拼错字的影响。如果键盘布局对用户打字时拼错的影响较小,则该布局符合用户体验习惯。 采集数据:我们随机抽取实验者,将实验者分为2组,每组25人,A使用键盘布局A,B使用键盘布局B。让他们在30秒内发布20个标准单词,然后记录每组错误单词的数量。 零假设和备选假设: 要研究的问题是用户体验更好? 根据这个问题,我提出了以下两个相反的假设。 零假设:A版本和B版本没有区别,也就是说,A版本平均值=B平均版本。 零假设总是表示研究没有改变,没有效果,没有效果,这里不符合标准。 备选假设:A版本和B版本不同,即A平均版本值不等于B平均版本。 检验有很多种,因为这里有两组样本,是不同的人,所以选择双独立样本进行检验。 在我们这个AB在测试案例中,样本大小为25(小于30),属于小样本。样本的抽样分布是否满足t分布呢?t分布也要求整体分布类似于正态分布,但我们不知道整体分布。我们可以通过样本数据集的分布来推断整体分布。 通过观察上述数据集的分布图,两个样本数据集都是近似正态分布的t分布的使用条件,所以抽样分布是t分布。 因为备选假设是A版本和B版本不同,即A平均版本值不等于B平均版本,所以我们使用双尾检查。 通过获取t值为2.0141。 独立样本检验的标准误差公式为 效应量:差异指标Cohen'sd这里的标准差,因为是双独立样本,需要合并标准差(pooledstandarddeviations)代替: 1、描述统计分析 A版本打错字的平均数量5.08一、标准差是2.06个 B版本打错字的平均数量7.8一、标准差是2.65个 2、假设检验独立双样本t(45)=-4.06,p=.00019(α=5%),双尾检查 拒绝零假设,统计显著。 2)两个平均值差的置信区间,95%的置信水平CI=[-4.07,-1.37] d=1.15 R2=0.65找到63657092个原创独立样本与相关样本的区别设计图片,包括独立样本与相关样本的区别图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材! 毕业证样本网创作《独立样本与相关样本(假设检验)的区别》发布不易,请尊重!
转转请注明出处:https://www.czyyhgd.com/177434.html