统计中的样本是什么意思(统计学中所谓的样本通常指的是什么)

摘要:
本文主要介绍了样本t检验在统计中的应用,包括比较两组定量数据的总体平均数是否存在差异的情况。文章详细解释了样本t检验的条件,包括正态性、方差齐性和独立性。同时,对于不同场景下的样本量计算也进行了说明。此外,文章还讨论了样本t检验的结论取决于研究设计,并强调了正态性检验的重要性。对于不同偏态分布的数据,提出了相应的处理方法。最后,文章指出大样本数据虽然可以采用样本t检验比较均值差异,但不能反映两组严重偏态数据的分布差异。

统计中的样本是什么意思?个人申请:最基本的统计方法

在实验研究中,最常见的研究设计是将研究对象随机分为试验组和对照组,以获得两组对象的研究结果,并使用统计方法来比较两组结果的整体差异。当两组结果是定量指标时,研究目标是讨论总体平均值是否存在差异,可以考虑的统计方法是两个样本t检验。

统计中的样本是什么意思(统计学中所谓的样本通常指的是什么)

1实例分析

将出生28天的20只大鼠随机分成两组,分别饲以高蛋白和低蛋白饲料,8周后观察其体重(g)。问两种不同饲料组的大鼠体重是否正常?数据见数据库weight.sav.

133、145、112、112、138、99、157、126、121、139、106,115

低蛋白组:118、75、106、87、94、110、102、124130

这个案例来自上一个故事,需要思考:

-这个案例由几个变量组成?

-什么是结局变量?

-结局变量属于什么类型的变量?

-若为定量变量数据,是偏态还是正态分布?

-研究的目的是比较。比较的组数是多少?

这种情况包括两个变量,一个是大鼠的体重(g),另一个是分组变量。研究的主要结果是老鼠的体重,这是定量变量数据;比较组数为两组(高蛋白组和低蛋白组)。本案例的目的是比较两组的总体平均数是否存在统计差异。

3统计分析策略

比较两组定量数据有两种主要方法。一个是两组样本t一种是非参数秩和检验(wilcoxon两个样本秩序和检验)。

一般来说,秩序和检查是t如果t如果检查不合适,就会考虑秩序和检查。因此,在统计分析中,应考虑t检查合适吗?条件满足吗?

总的来说,t对两组、定量、正态、独立、方差的数据进行比较。前两个要求和wilcoxon两样本秩和检验相同,区别在于t检验要求数据符合正态性、独立性和方差齐性三个要求。这里简单解释一下三个性。

正态。正态条件要求每组数据的总体分布为正态分布。一般来说,要求正态检查P>0.05。另外,在实际操作中,P≤0.05,但是,直方图显示大致正态也可以(类似于正态分布)。上一篇文章已经说明了正态性。此外,这里的正态性要求是指每组数据(本例为2组数据)分别满足条件。

独立性。独立性意味着两组数据的观察值是相互独立的,这意味着两组数据没有相互关联。例如,临床研究有两组数据,即14名高血压患者服用降压药前的血压和服用后的血压。显然,如果著名患者服用前血压高,服用后血压不会低;相反,如果服用前血压低,服用后血压不会高,因此两组数据是相关的。一般来说,如果医学研究是随机分组的,那么两组数据通常可以被视为独立的。如果是配对设计,那么两组数据就不是独立的!因此,一般来说,我们可以根据研究和设计来判断独立性的特点。方差齐。方差齐意味着两组数据的方差大致相同。所谓方差是标准差平方,实际上意味着标准差大致相同。例如,有两组数据20±10,20±20。这意味着标准差是两倍,方差是三倍,方差是非常不同的。这种情况不能直接使用t检查。统计软件的论证也是通过统计软件完成的;如果方差不均匀,有类似的替代方法,我稍后介绍。

总结来说:

在这种情况下,独立性是一致的,毕竟这是随机分组设计。

在正态性方面,对本案例进行了分析,采用了多样本正态性检验方法,讨论每个小组是否来自整体正态分布。结果直接发布在这里:

经SW结果是:高蛋白组体重P=0.977,低蛋白组体重P=0.974,两组数据的正态性没有统计意义。

至于方差的齐性,一般与SPSSt结果一起产生,我们稍后围观。

SPSS操作

本日软件操作的SPSS数据库是weight.sav,加入课程组即可获得。

1t检验SPSS操作界面:分析—比较均值—独立样本t检验

2两样本t检查具体参数设置

检验变量放入体重(weight),将分组变量放入分组中(group),同时进行定义组。

定义组:即指定比较哪两组。在本例,我们比较高蛋白和低蛋白组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。因此提醒诸位:构建SPSS建议在数据库中使用数字,而不是文字或字母。

3两样本t检验分析结果及解释

t检验统计分析有两个表,一个是组统计,另一个是独立样本检验。组统计分别提供两组数据的样本数(n)、平均值(mean)、标准差(SD)、标准误(SE)。

第二第二张表t结果分为三部分

①莱文方差等同性检验:levene上面提到了方差齐性检查t检查应符合方差齐,方差是否相似?这是假设检查结果,显著性是P值,若P>0.05,认为方差齐性,若P≤0.05,可以认为方差不齐。这个问题。P=0.887,所以方差齐。

②这是假设检验的核心结果。结果分为假设等方差(方差齐)两行t我们称检验结果为不假设等方差(方差不均匀)t检验(校正)t检验,SPSS校正自由和t值),),

换句话说,如果方差齐,则使用t检查,看第一行t检查结果。如果方差不均匀,一般可以使用t'检验(SPSS校正自由和t看第二行统计分析的结果。

因此,本题方差齐t=2.671,P=0.016,差异具有统计意义。

③这里给出了两组数据平均值、标准误差和差值的95置信区间(95%CI)上下限。

结果及表格的规范表达

根据上表,我们可以得出以下规范结论:

标准文字:高蛋白饲料组大鼠体重为(126.45±17.76)g,低蛋白饲料组大鼠体重(105.11±17.80)g,两组总体重平均值存在统计差异(差值21.34,95%CI4.56-38.13,t=2.67,P=0.016)。

规范统计表(其中一种形式)为:

①如今,越来越多的文章需要提供95%的平均值差异CI,因此,强烈建议您在今后的统计分析中写95%的差值CI。本例的95%CI为(4.56-38.13),以上SPSSt请注意分析结果表中的搜索。

②t可提供检验结果t不能提供值t最好提供值P值,t和P需要斜体。

③小数点一般保留1-2位,其实一位就可以了,P除外。许多杂志需要不同的要求P值提供小位数不同,但P保持3位的值不会错。如果你遇到它,SPSS结果为0.000的,书写成<0.001。

可以看看另外一个文献的表格,同样提供的是多个结局的差值、置信区间和P值。

敲黑板!统计分析结果的文字和表格,三样东西要提供,一样是效应值(本例是差值)、一样是效应值的95%CI、另外一样是P值。以往置信区间往往不受重视,现在必须重视起来!

何种场景可以采用两样本t检验呢?

1. 两组均数比较的研究,如何计算样本量?

比如动物实验,高蛋白组和低蛋白饲料喂养大鼠的动物实验;两组临床试验,比较两种药物收缩压均数有无的差别?

这些研究样本量如何计算?

2021年,郑老师团队,为初学者折腾一个简单又好使的样本量计算小工具,结合公式和EXCEL,非常好使,如果您需要,不妨来下载使用把。当然免费!

详细介绍:这款高校老师制作的免费工具,手把手教你计算样本量!第2版出炉

2.t检验结论取决于研究设计

t检验是最基本的假设检验方法,在随机、对照、平行的实验性研究中,t检验的结论十分可靠,完全证明一个干预措施是否真正产生效果,或者干预措施和定量结局是否存在着因果关系。

但是t检验如果用在非干预性的观察性研究,比如比较男性、女性的体重有无差别,其结论不能说性别是体重的影响因素,只能说男性和女性体重存在着统计学差异,仅此而已。关于观察性研究t检验,后期再进行分析。

因此,t检验结果到底能够说明什么问题,取决于研究设计。

3.t检验三个条件正态性、方差齐性和独立性一般最好遵守,但是条件不是那么死板。

对于独立性,一般情况下都是符合的,除了配对设计之外,所有诸位也不用特别担心。方差齐性,这个条件影响其实不大,无论方差齐不齐,从广义上来说采用的都是t检验。

对于正态性,需要说道说道。上一讲day 2 我介绍过,我们可以把正态性分为三类,以方便操作。

第一:正态性检验P>0.05,中间多两边少的直方图显然是第一个t检验方法

二是正态检查P≤0.05(但一般小样本时P值>0.01),直方图大致具有中间多、两侧少的特点。我称之为近似正态分布。在这种情况下,可能存在一两个不太极端的异常值,或者临床上该指标是正态的,因此选择样本有点奇怪。虽然属于偏态分布,但t检验也可以用(毕竟用均数描述,t检验更容易理解);特别是当一组正态分布和另一组近似正态分布时,t检查没有问题。但近似非参数检测方法肯定没有错。因此,可以选择近似正态分布。t根据情况进行检查或非参数检查。例如,你分析多个指标,其中大多数是t检验,一两个指标类似于正态分布,干脆全部使用t相反,如果大部分都是严重偏态分布,即使一两个指标类似正态,也不妨弃用t检验。

第三:严重偏差,正态检查P<0.05,任何一组数据直方图偏态严重,呈一边倒现象。造成这种现象的原因是,有严重的极端值,或者理论上是偏态分布。此时,不应使用它t检验。

有人会问,偏态有多严重,我觉得没有界限,就像t检查和秩序和检查没有明显的界限,所以我设置了一种缓冲(类似正态)。有人建议用偏态系数来评价,我觉得只是增加了事情的复杂性。

4.对比两组较大样本(如100以上样本量)的数据,能否采用严重偏态分布?t检验?

根据互联网上甚至统计教科书,大样本数据可以忽略正态性问题。他们认为,根据中心极限定理,无论样本来自哪种分布,只要样本量足够大(一般认为样本量大于50就足够大或大于100),样本平均值就类似于服从正态分布。因此,当样本量较大时,正态问题可以完全忽略,参数检测方法仍然可以使用。

这是错误的。采用中心极限理论t检查本身没有错。基于平均数t可以比较两组大样本数据均数的差异。我们不能用两组严重的偏态分布来表达数据,也不能用平均来描述数据。t可以说两组均数有没有差异,但均数的差异并不能说明两组严重偏态数据的差异(至少要用中位数来体现)。t即使你是大样本,检验结论也不能反映两组严重偏态数据的分布差异!

毕业证样本网创作《统计中的样本是什么意思(统计学中所谓的样本通常指的是什么)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/149204.html

(0)
上一篇 2022年4月17日
下一篇 2022年4月17日

相关推荐

  • 二建社保证明样本(二建社保证明材料指的是什么)

    摘要:
    关于二建考试是否需要社保证明,以及社保证明中断、开具等问题。马鞍山二建需个人社保,社保需每年缴够6个月且不能中断。个人社保缴费证明要求因地区政策而异,以南京为例,个人需出示参保缴费证明,由申请服务项目科室在查询表上盖章。单位需出示证明,经审核后盖章。对于未参保或缴费不实的单位,将进行自查整顿或追踪管理。考二建需按属地原则报名,新学生需带上有效证件、毕业证书等报名,老学生只需提交申请表。部分省区要求提供社保证明或劳动合同书证明考生具有相应的工作年限。私企未缴纳社保的情况需要另外寻找解决方案,没有固定社保证明样本可查。

    2022年4月13日
    220
  • 统计中样本是指(统计学中所谓的样本通常指的是什么)

    摘要:文章介绍了统计研究中的样本概念及其要求,指出样本是从整体中按照一定规则抽取的部分个体,样本容量指样本中的个人数量。还介绍了概率统计中的基本概念,包括样本总数、事件、互斥事件、独立事件、条件概率等,并说明了这些概念在概率统计研究中的应用。

    2022年4月17日
    260
  • 统计中的样本是什么意思(统计学中所谓的样本通常指的是什么)

    摘要:
    本文主要介绍了样本t检验在统计中的应用,包括比较两组定量数据的总体平均数是否存在差异的情况。文章详细解释了样本t检验的条件,包括正态性、方差齐性和独立性。同时,对于不同场景下的样本量计算也进行了说明。此外,文章还讨论了样本t检验的结论取决于研究设计,并强调了正态性检验的重要性。对于不同偏态分布的数据,提出了相应的处理方法。最后,文章指出大样本数据虽然可以采用样本t检验比较均值差异,但不能反映两组严重偏态数据的分布差异。

    2022年4月17日 下午1:18
    390
  • 树苗两证一签样本(苗木的两证一签指的是什么)

    摘要:文章介绍了如何在春季购买苗木时查询两证一签样本,以及新疆一家果蔬公司在购买苹果幼苗时遇到的问题。通过农业技术鉴定,发现部分幼苗死亡是由于未及时灌溉和运输储存过程中未持有两证一签导致的。因此,在购买和使用苗木时,应注意查询相关证书以确保苗木质量。

    2022年4月17日
    290
  • 增值税发票样本是什么意思?(与纸质增值税专用发票相比,增值税电子专用发票样本有哪些变化)

    摘要:增值税发票样本包括纸质增值税专用发票和电子增值税专用发票,电子发票在货物或服务名称、发票风格和发票专用章方面有所简化。建筑服务承包商和甲方供应项目可选择简易计税方法。出口退税增值税专用发票的抵扣检查和申报需根据国家税务总局公告调整使用。新能源汽车在特定时间段内购买的可享受免征车辆购置税优惠,具体条件包括车型需列入工信部、税务总局发布的目录,汽车企业需确保车辆电子信息与车辆产品一致等。

    2022年4月28日
    220
客服微信
客服微信
返回顶部