统计分析步骤如下图所示
本文将对三种不同类型的样本进行详细的检查和分析,并得出分析报告:样本与标本的区别
单样本检验分析---评估汽车发动机排放要求的相关配对检查分析---体内容和字体颜色的斯特鲁普效应独立双样本检验分析---手机键盘版A/B试验设计:样品与标本的区别
超级发动机是一家专门生产汽车发动机的公司。根据政府发布的新排放要求,发动机平均排放值低于20ppm,(ppm这是英语百万分之一的缩写。在这里,我们只需要理解汽车尾气中的碳氢化合物低于环保要求20ppm)。
公司生产10台发动机进行测试,每台排放水平如下:样品与标本的区别
15.616.222.520.516.419.416.617.912.713.9
如何知道公司生产的引擎是否符合政府规定?
第一部分是描述统计分析,如平均值和标准差。描述统计是研究的核心,告诉我们研究中发生了什么。
推论统计分析报告包括:假设检验、信心范围、效应量
1)问题是什么?
1.1)零假设和备选假设
问题:这些样本数据符合新标准吗?根据这个问题,我提出了以下两个相反的假设。H0:公司引擎排放不满足标准,也就是平均值u>=20。这里的20是政府规定新标准的最低可能值。零假设总是表示研究没有改变,没有效果,没有效果,这里不符合标准。替代假设H1:公司发动机排放符合标准,即平均值u<20
1.2)检验类型
有很多类型的测试,因为这里只有一个样本,所以选择一个样本进行测试。单样本检验(只有一组数据)的目的是检查相关(配对)样本的平均值是否等于目标值
1.3)抽样分布类型
由于抽样分布的类型抽样分布,因为抽样分布的类型决定了以后的计算p值的不同。
在我们的汽车发动机案例中,样本大小为10(小于30),属于小样本。样本的抽样分布是否满足t分布呢?
因为t分布还要求数据集近似正态分布,所以我们来看看下图中样本数据集的分布。
通过观察上述数据集的分布图,数据集据集的近似正态分布t抽样分布的使用条件是t分布,自由df=n-1=10-1=9。
1.4)检验方向
单尾检查(左尾、右尾)还是双尾检查?
因为备选假设公司的引擎排放符合标准,即平均值u所以我们在单尾检查中使用左尾检查
综合以上分析,本假设检验为单样本t单尾检查中的左尾检查。
2)证据是什么?
在零假设成立的前提下,获得样本平均值的概率p多少?p值步骤也很简单:
2.1)计算标准误差
标准误差=样本标准差除以样本大小n这里的样本标准差用于估计总体标准差
2.2)计算t值
t=(样本平均值-总体平均值/标准误差
2.3)根据t自由度计算概率p值
3)什么是判断标准?
判断标准(阿尔法显著水平)α)α=5%表示区间分为95%和5%的可信度,表示95%的概率是正确的、可信的,5%的概率是不可信的。
阿尔法水平显著α可行性越小,越高,α常设为5%
4)做出结论
我们使用许多科学APA报告假设检验结果的格式。APA美国心理学会,APA格式是美国心理学会对如何撰写研究论文给出的完整指南,其中一部分告诉我们如何撰写推论统计结果。
写在图中t检验结果的一般规则:t(df)=x.xx,p=.xx,检验方向
根据图中标注的序列号,请在报告假设检查时告知读者以下信息:
检验类型、抽样分布类型、t值、p值、α值,检查方向
什么样的检验是首先执行的?在这个例子中是单样本t检验,接着在括号中写出自由度,写上等号,然后给出t值,保留两位小数。写逗号,然后给出p值,保留两位小数,然后输出逗号,指出检查方向。是单尾检查还是双尾检查。
总是让读者知道你在做决定时使用的显著程度。
综合以上分析,本假设检验为独立样本t(9)=-3.00,p=0.0074(α=5%)单尾检查(左尾)
图片里是APA格式置信区间,如95%的平均置信区间CI=(a,b),由以下三种元素组成:
1)信心区间类型
例如,单个样本检验是单个平均值的信心范围,但我们后面要讨论的相关样本检验是两个平均值之间的差异。在这种情况下,我们是单个平均值的信心范围
2)置信水平
这是95%的信心水平
3)置信区间
置信区间(简写为CI)以及区间的上下限(a,b),上下限写在括号中
前两步和第五步t值不同
1)第二步是什么证据?
计算p值里的t值,不是从t表格是用公式计算的t=(样本平均值-总平均值)/标准误差,然后用这个计算t值再去t表格里去查找出p值
2)第五步,置信区间
t_ci信心水平t值是基于95%的信心水平t在表格中找到的t值。和前面的t因此增加了后缀值差异t_ci
报告中还需要给出效应量(effectsize)。什么是效应量?
效应量是指处理效应的大小,如药物A比药物B效果显著。测量效应量有很多种,但大多属于两大类。
1)差异度量
例如,在比较平均值时,衡量效果大小的常用标准之一是Cohen'sd
Cohen'sd=(样本平均值1-样本平均值2
Cohen'sd除标准差外,即以标准差为单位,样本平均值与整体平均值的差异。
2)相关度度量
例如:R平方表示一个变量的变化比与另一个变量的关系。t发布检验信息R这里的平方公式t值从t检验中获得的值,df是自由度。
R^2=t^2/(t^2 df),其中R^2是指r的平方,t^2是t的平方
如果R平方等于20%,这意味着我们可以说,通过知道另一个变量可以接受相关变量20%的变化
为什么要给出效应量?
在判断调查研究结果是否有意义或重要时,应考虑的另一个指标是效应量。效应量太小,即使处理达到显著水平,也缺乏实用价值。
因此,在假设检验中,我们给出了统计显著性和效应量,以判断研究结果是否有意义。
效应量报告格式:d=x.xx,R2=.xx
d=-0.95,|d|=0.95大于0.8,因此,样本平均值与总平均值之间的差异0.95标准差表明当前汽车发动机排放效果显著
3.1描述统计分析
样本平均值17.17ppm,样本标准差2.98ppm
3.2推论统计分析
1)假设检验
独立样本t(9)=-3.00,p=0.0074(α=5%)单尾检查(左尾)
公司发动机排放符合标准,统计显著
2)置信区间
95%的信心区间为平均值CI=(17.11,17.23),样本的总平均值可能是95%(17.11,17.23)之内
3)效应量
d=-0.94,样本平均值与总平均值之间的差异0.95标准差表明当前汽车发动机排放效果显著
特鲁普效应是一种著名的心理现象,表明人们对事物的认知过程是一个自动化的过程。当出现新的刺激时,如果其特征与原始刺激相似或一致,就会加速人们的认知;相反,如果新的刺激特征与原始刺激不同,就会干扰人们的认知,延长人们需要的反映数据。
简单来说,斯特鲁普效应是人们在出现与原始认知不同的情况时,反应时间会更长。
每个参与者得到两组彩色文本。第一组数据是字体内容与字体颜色一致,第二组数据是字体内容与字体颜色不一致。每个参与者告诉每组文本的颜色,并分别计算完成每组的时间。本实验共记录了25组数据(样本量),并进行了总结Excel表格中。
观察数据结果:
当字体内容与字体颜色一致时,实验者的反应时间(单位:秒)为一致列。
不一致列是实验者在字体内容与字体颜色不一致时的反应时间。
使用柱状图对两个样本数据进行比较
描述统计分析结果:第一组数据:当字体内容与字体颜色一致时,实验者的平均反应时间为:13.89044秒,标准差是3.第二组数据:当字体内容与字体颜色不一致时,实验者的平均反应时间为:22.62428秒,标准差是5.秒不一致时间大于一致,即当字体内容和字体验证不一致时,实验者的平均反应时间较长
自变量是指原因。因为变量是指结果,即自变量变化引起的值是因变量。自变量:我们有两组实验数据。第一组是字体内容和颜色一致。第二组数据值是字体内容和颜色不一致。因此,自变量是实验数据的颜色和文本是否相同。因为变量:实验者的反应时间。因此,我们需要调查自变量(字体内容和颜色是否相同)对因变量(反应时间)的影响。问题:特鲁普效应存在吗?
假设第一组“一致”的均值为u1,第二组不一致均值为u2
零假设H0:特鲁普效应不存在,人们完成测试的时间不会因为字体内容和颜色的变化而变长(第一组的平均值u1=第二组平均值u2)
备选假设H1:特鲁普效应确实存在。当颜色和文本发生变化时,人们完成测试的时间会变长(第一组平均值为第二组平均值)
有很多类型的测试,因为两组数据来自同一组测试人员,所以这两组数据是相关样本,所以选择相关的配对测试。
相关配对检验(多组数据,但数据来自同一组测试对象)的目的:检查相关(配对)样品的平均值是否等于目标值
相关配对检查只关注每对相关数据的差异,以避免参与者之间正常反应时间独立性的影响。在只关注差异集的情况下,只有一组(差异集)。让我们处理样本数据,以获得差异集。
我们还需要判断哪种抽样分布?由于抽样分布的类型决定了以后的计算p值的不同。
在我们的情况下,样本大小为25(小于30),属于小样本。小样本的抽样分布是否满足t分布呢?t分布还要求数据集近似正态分布,所以我们来看看下图中差值数据集的分布。
通过观察上述差值数据集的分布图,数据集与正态分布相似,以满足要求t对于分布的使用条件,我们可以使用相关样本t检验。
根据备选假设,特鲁普效应确实存在StroopEffect当颜色和文字不同时,人们的完成测试时间会变长(u1 因此,我们使用单尾检查 {n} 在零假设成立前提下,得到样本平均值的概率p是多少? {n} 假设检验报告: {n} 相关配对检验t(
左尾检验,显著水平为5%,t检验的自由度df=n-1=25-1=24
毕业证样本网创作《样本与标本的区别(样本检验)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/180559.html