如何求高中样本容量(临床研究专题|如何计算样本容量)

摘要:

本文介绍了代谢组研究中样本量的计算方法和临床研究主题的设计思路。通过两个经典案例详细阐述了代谢组研究中biomarker筛选过程的三个阶段。同时,将机器学习的概念引入样本量估算和阶段划分中,解释了发现阶段、训练集、验证集和测试集的具体含义及其在实际研究中的应用。文章详细解释了影响样本量计算的重要参数,包括研究设计类型、结局指标类型等,并介绍了样本纳排标准的注意事项。最后,强调了代谢组研究中样本选择的重要性和严格性。文章旨在为代谢组研究中的样本量计算和临床研究主题设计提供指导。

如何计算临床研究主题|样本量?这篇文章一看就知道了

对于代谢组来说,目前比较容易进行的临床研究类型是观察性横截面研究,即通过代谢组找到与某种疾病相关的代谢标志物,后续诊断疾病或进行一些基本的机制研究。因此,让我们分享横截面研究的方案设计、样本量计算和样本排列标准。

如何求高中样本容量(临床研究专题|如何计算样本容量)

方案设计首先要看两个案例:样本容量如何求高中

时间:如何求高中样本容量?

2022年度期刊何求高中样本容量?

GastroenterologyIF:19.819分

研究思路:

发现阶段1对360名受试者进行高通量代谢组检测,筛选出30种差异代谢物;发现阶段2对1594名受试者进行高通量检测,筛选出7种与发现阶段1共有的差异代谢物,然后通过二元逻辑回归分析得出2种潜在代谢物biomarker;对900名受试者(来自发现阶段2)进行建模阶段biomarker对1528名受试者进行靶向检测,并建立了诊断模型;验证阶段对1528名受试者进行2次biomarker靶向检测验证了模型的诊断效率。

时间:2022年期刊:GutIF:19.819分

在发现阶段,对92例受试者的血清进行了高通量代谢组检测,并选择了44例与血清相匹配的粪便样本进行宏基因组检测。经联合分析,确定322种与肠道微生物组相关的代谢物LASSO算法筛选和识别8种代谢物;72例正常个体和120例结直肠异常患者,用靶向方法测量8种代谢物的丰度,逻辑回归生成预测模型;103例结直肠异常患者和53例健康个体,评估了该模型的预测性能。通过以上两个经典案例,不难发现代谢组biomarker筛选过程通常包括三个阶段:①在发现阶段,通过高通量代谢组筛选候选人biomarker;②在建模阶段,通过靶向方法检测和筛选在建模队列中biomarker,并构建判别模型;③验证阶段在验证队列中靶向检测biomarker,验证模型判断效率。

那我们在代谢组文章中经常看到的发现集、训练集、验证集和测试集分别是指的哪个阶段呢?

这些词实际上来自机器学习的过程。在机器学习中,样本一般分为三个独立部分:训练集(trainset),验证集(validationset)和测试集(testset)。

培训集-用于模型拟合的数据样本。验证集-是模型培训过程中单独留下的样本集,可用于调整模型的超参数,初步评估模型的能力。测试集-用于评估最终模型的泛化能力。但不能作为与参数调整、选择特征等算法相关的选择依据。如果将这些概念映射到代谢标志物筛选过程中,发现阶段1中的人对应于培训集,有些文章也称为发现集;发现阶段2中的人对应于验证集;验证阶段的人对应于测试集;建模阶段的人可以来自验证集或测试集(独立于验证阶段的人)。

在明确了样本量估算的研究思路具体的样本数应该如何估算。

影响样本量计算的重要参数如下:

①研究设计类型(如横截面研究或随机对照研究)

②结局指标类型(二分类变量或连续变量)

③结局指标的预期值(敏感性或特异性或平均值)AUC)

④容许误差

检验水准α(通常取α=0.05)检验效能1-β(通常为80%或更高)Case组与control组的比例:control组的样本量一般不小于Case组的样本量,通常是等量的。

单样本临床诊断试验的样本量计算方法如下:

样本量按灵敏度和特异性计算

δ研究人员人为指定了允许的灵敏度或特异度95%的宽度,通常在0.03~0.1。

例如,将参数设置为:

特异度:90%±10%敏感度:80%±10%;显著水平(α)0.05;置信度(1-α):0.95;检验类型:two-sidedtest根据公式计算:

根据敏感性和特异性计算两个样本量值,选择较大的样本量。样本量为62例。

也可使用PASS直接计算软件:

计算所得样本量敏感度

特异度计算所得样本量

本例结果显示,通过敏感度计算所得N=70,收入由特异度计算N=44,选择数值较大的人需要70个研究对象。

PASS软件计算结果与公式计算结果略有偏差,可选择样本数大的结果,即所需样本数为70例,病例70例。

根据AUC样本量计算软件:MedCalc

预计AUC=0.9

检验水准α:0.05

检验效能1-β:0.9

无效假设:AUC=0.8

根据软件计算,样本量为82 82=164例。

在机器学习中,一般训练集、验证集和测试集的分割比为6:2:2。如果没有验证集,训练集和测试集的分割比为7:3,映射到代谢标志物筛选过程中,相应的建模队列和验证队列的比例为7:3。

样本纳排标准代谢组的结果容易受到环境等外部因素的影响,因此如果要筛选真阳性代谢biomarker,样品的入组条件需要严格限制。

样本纳入条件:

1.根据实验设计,随机选择符合分组要求的样本。

2.尽量保证与研究无关的临床指标,如年龄、性别等。

3.样品选择应尽可能具有时间和地域的随机性。

4.样品符合采样标准流程,相应的临床信息完整。

临床信息的收集如下表所示:

样品排除条件:

1.样本具有严重的急性感染;

2.样本贫血严重;

3.样本肝肾功能不全;

4.样本患有肿瘤或多个肿瘤;

5.妊娠期样本;

6.样本患有自身免疫缺陷疾病;

7.样本患有高脂血症和高黄疸。

上述排除条件仅适用于非本病的研究(即如果对妊娠期糖尿病进行相关研究,则不适用第除条件不适用)。如何找到24200325个高中设计图片的原始样本容量,包括如何找到高中图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!

毕业证样本网创作《如何求高中样本容量(临床研究专题|如何计算样本容量)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/186692.html

(0)
上一篇 2022年5月1日
下一篇 2022年5月1日

相关推荐

  • 排便样本几个小时合理(微生物菌种组 代谢组:粪便样本究竟如何收)

    摘要:本文探讨了排便样本的合理收集和处理方法,包括样本量、收集容器、储存条件和注意事项等。文章指出不同部位的粪便样本在微生物菌群和代谢组学方面存在差异,需使用无菌收集容器进行收集,并及时标识和低温保存。同时强调了样本量要充足,以避免污染和分解。文章还提供了粪便样本收集流程和参考文献,以便读者参考和引入。

    2022年5月1日
    250
  • 如何求高中样本容量(临床研究专题|如何计算样本容量)

    摘要:

    本文介绍了代谢组研究中样本量的计算方法和临床研究主题的设计思路。通过两个经典案例详细阐述了代谢组研究中biomarker筛选过程的三个阶段。同时,将机器学习的概念引入样本量估算和阶段划分中,解释了发现阶段、训练集、验证集和测试集的具体含义及其在实际研究中的应用。文章详细解释了影响样本量计算的重要参数,包括研究设计类型、结局指标类型等,并介绍了样本纳排标准的注意事项。最后,强调了代谢组研究中样本选择的重要性和严格性。文章旨在为代谢组研究中的样本量计算和临床研究主题设计提供指导。

    2022年5月1日 上午12:50
    250
客服微信
客服微信
返回顶部