统计中的样本是什么意思?个人申请:最基本的统计方法
在实验研究中,最常见的研究设计是将研究对象随机分为试验组和对照组,以获得两组对象的研究结果,并使用统计方法来比较两组结果的整体差异。当两组结果是定量指标时,研究目标是讨论总体平均值是否存在差异,可以考虑的统计方法是两个样本t检验。
1实例分析
将出生28天的20只大鼠随机分成两组,分别饲以高蛋白和低蛋白饲料,8周后观察其体重(g)。问两种不同饲料组的大鼠体重是否正常?数据见数据库weight.sav.
133、145、112、112、138、99、157、126、121、139、106,115
低蛋白组:118、75、106、87、94、110、102、124130
这个案例来自上一个故事,需要思考:
-这个案例由几个变量组成?
-什么是结局变量?
-结局变量属于什么类型的变量?
-若为定量变量数据,是偏态还是正态分布?
-研究的目的是比较。比较的组数是多少?
这种情况包括两个变量,一个是大鼠的体重(g),另一个是分组变量。研究的主要结果是老鼠的体重,这是定量变量数据;比较组数为两组(高蛋白组和低蛋白组)。本案例的目的是比较两组的总体平均数是否存在统计差异。
3统计分析策略
比较两组定量数据有两种主要方法。一个是两组样本t一种是非参数秩和检验(wilcoxon两个样本秩序和检验)。
一般来说,秩序和检查是t如果t如果检查不合适,就会考虑秩序和检查。因此,在统计分析中,应考虑t检查合适吗?条件满足吗?
总的来说,t对两组、定量、正态、独立、方差的数据进行比较。前两个要求和wilcoxon两样本秩和检验相同,区别在于t检验要求数据符合正态性、独立性和方差齐性三个要求。这里简单解释一下三个性。
正态。正态条件要求每组数据的总体分布为正态分布。一般来说,要求正态检查P>0.05。另外,在实际操作中,P≤0.05,但是,直方图显示大致正态也可以(类似于正态分布)。上一篇文章已经说明了正态性。此外,这里的正态性要求是指每组数据(本例为2组数据)分别满足条件。
独立性。独立性意味着两组数据的观察值是相互独立的,这意味着两组数据没有相互关联。例如,临床研究有两组数据,即14名高血压患者服用降压药前的血压和服用后的血压。显然,如果著名患者服用前血压高,服用后血压不会低;相反,如果服用前血压低,服用后血压不会高,因此两组数据是相关的。一般来说,如果医学研究是随机分组的,那么两组数据通常可以被视为独立的。如果是配对设计,那么两组数据就不是独立的!因此,一般来说,我们可以根据研究和设计来判断独立性的特点。方差齐。方差齐意味着两组数据的方差大致相同。所谓方差是标准差平方,实际上意味着标准差大致相同。例如,有两组数据20±10,20±20。这意味着标准差是两倍,方差是三倍,方差是非常不同的。这种情况不能直接使用t检查。统计软件的论证也是通过统计软件完成的;如果方差不均匀,有类似的替代方法,我稍后介绍。
总结来说:
在这种情况下,独立性是一致的,毕竟这是随机分组设计。
在正态性方面,对本案例进行了分析,采用了多样本正态性检验方法,讨论每个小组是否来自整体正态分布。结果直接发布在这里:
经SW结果是:高蛋白组体重P=0.977,低蛋白组体重P=0.974,两组数据的正态性没有统计意义。
至于方差的齐性,一般与SPSSt结果一起产生,我们稍后围观。
SPSS操作
本日软件操作的SPSS数据库是weight.sav,加入课程组即可获得。
1t检验SPSS操作界面:分析—比较均值—独立样本t检验
2两样本t检查具体参数设置
检验变量放入体重(weight),将分组变量放入分组中(group),同时进行定义组。
定义组:即指定比较哪两组。在本例,我们比较高蛋白和低蛋白组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。因此提醒诸位:构建SPSS建议在数据库中使用数字,而不是文字或字母。
3两样本t检验分析结果及解释
t检验统计分析有两个表,一个是组统计,另一个是独立样本检验。组统计分别提供两组数据的样本数(n)、平均值(mean)、标准差(SD)、标准误(SE)。
第二第二张表t结果分为三部分
①莱文方差等同性检验:levene上面提到了方差齐性检查t检查应符合方差齐,方差是否相似?这是假设检查结果,显著性是P值,若P>0.05,认为方差齐性,若P≤0.05,可以认为方差不齐。这个问题。P=0.887,所以方差齐。
②这是假设检验的核心结果。结果分为假设等方差(方差齐)两行t我们称检验结果为不假设等方差(方差不均匀)t检验(校正)t检验,SPSS校正自由和t值),),
换句话说,如果方差齐,则使用t检查,看第一行t检查结果。如果方差不均匀,一般可以使用t'检验(SPSS校正自由和t看第二行统计分析的结果。
因此,本题方差齐t=2.671,P=0.016,差异具有统计意义。
③这里给出了两组数据平均值、标准误差和差值的95置信区间(95%CI)上下限。
结果及表格的规范表达
根据上表,我们可以得出以下规范结论:
标准文字:高蛋白饲料组大鼠体重为(126.45±17.76)g,低蛋白饲料组大鼠体重(105.11±17.80)g,两组总体重平均值存在统计差异(差值21.34,95%CI4.56-38.13,t=2.67,P=0.016)。
规范统计表(其中一种形式)为:
①如今,越来越多的文章需要提供95%的平均值差异CI,因此,强烈建议您在今后的统计分析中写95%的差值CI。本例的95%CI为(4.56-38.13),以上SPSSt请注意分析结果表中的搜索。
②t可提供检验结果t不能提供值t最好提供值P值,t和P需要斜体。
③小数点一般保留1-2位,其实一位就可以了,P除外。许多杂志需要不同的要求P值提供小位数不同,但P保持3位的值不会错。如果你遇到它,SPSS结果为0.000的,书写成<0.001。
可以看看另外一个文献的表格,同样提供的是多个结局的差值、置信区间和P值。
敲黑板!统计分析结果的文字和表格,三样东西要提供,一样是效应值(本例是差值)、一样是效应值的95%CI、另外一样是P值。以往置信区间往往不受重视,现在必须重视起来!
何种场景可以采用两样本t检验呢?
1. 两组均数比较的研究,如何计算样本量?
比如动物实验,高蛋白组和低蛋白饲料喂养大鼠的动物实验;两组临床试验,比较两种药物收缩压均数有无的差别?
这些研究样本量如何计算?
2021年,郑老师团队,为初学者折腾一个简单又好使的样本量计算小工具,结合公式和EXCEL,非常好使,如果您需要,不妨来下载使用把。当然免费!
详细介绍:这款高校老师制作的免费工具,手把手教你计算样本量!第2版出炉
2.t检验结论取决于研究设计
t检验是最基本的假设检验方法,在随机、对照、平行的实验性研究中,t检验的结论十分可靠,完全证明一个干预措施是否真正产生效果,或者干预措施和定量结局是否存在着因果关系。
但是t检验如果用在非干预性的观察性研究,比如比较男性、女性的体重有无差别,其结论不能说性别是体重的影响因素,只能说男性和女性体重存在着统计学差异,仅此而已。关于观察性研究t检验,后期再进行分析。
因此,t检验结果到底能够说明什么问题,取决于研究设计。
3.t检验三个条件正态性、方差齐性和独立性一般最好遵守,但是条件不是那么死板。
对于独立性,一般情况下都是符合的,除了配对设计之外,所有诸位也不用特别担心。方差齐性,这个条件影响其实不大,无论方差齐不齐,从广义上来说采用的都是t检验。
对于正态性,需要说道说道。上一讲day 2 我介绍过,我们可以把正态性分为三类,以方便操作。
第一:正态性检验P>0.05,中间多两边少的直方图显然是第一个t检验方法
二是正态检查P≤0.05(但一般小样本时P值>0.01),直方图大致具有中间多、两侧少的特点。我称之为近似正态分布。在这种情况下,可能存在一两个不太极端的异常值,或者临床上该指标是正态的,因此选择样本有点奇怪。虽然属于偏态分布,但t检验也可以用(毕竟用均数描述,t检验更容易理解);特别是当一组正态分布和另一组近似正态分布时,t检查没有问题。但近似非参数检测方法肯定没有错。因此,可以选择近似正态分布。t根据情况进行检查或非参数检查。例如,你分析多个指标,其中大多数是t检验,一两个指标类似于正态分布,干脆全部使用t相反,如果大部分都是严重偏态分布,即使一两个指标类似正态,也不妨弃用t检验。
第三:严重偏差,正态检查P<0.05,任何一组数据直方图偏态严重,呈一边倒现象。造成这种现象的原因是,有严重的极端值,或者理论上是偏态分布。此时,不应使用它t检验。
有人会问,偏态有多严重,我觉得没有界限,就像t检查和秩序和检查没有明显的界限,所以我设置了一种缓冲(类似正态)。有人建议用偏态系数来评价,我觉得只是增加了事情的复杂性。
4.对比两组较大样本(如100以上样本量)的数据,能否采用严重偏态分布?t检验?
根据互联网上甚至统计教科书,大样本数据可以忽略正态性问题。他们认为,根据中心极限定理,无论样本来自哪种分布,只要样本量足够大(一般认为样本量大于50就足够大或大于100),样本平均值就类似于服从正态分布。因此,当样本量较大时,正态问题可以完全忽略,参数检测方法仍然可以使用。
这是错误的。采用中心极限理论t检查本身没有错。基于平均数t可以比较两组大样本数据均数的差异。我们不能用两组严重的偏态分布来表达数据,也不能用平均来描述数据。t可以说两组均数有没有差异,但均数的差异并不能说明两组严重偏态数据的差异(至少要用中位数来体现)。t即使你是大样本,检验结论也不能反映两组严重偏态数据的分布差异!
毕业证样本网创作《统计中的样本是什么意思(统计学中所谓的样本通常指的是什么)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/149204.html