如何计算临床研究主题|样本量?这篇文章一看就知道了
对于代谢组来说,目前比较容易进行的临床研究类型是观察性横截面研究,即通过代谢组找到与某种疾病相关的代谢标志物,后续诊断疾病或进行一些基本的机制研究。因此,让我们分享横截面研究的方案设计、样本量计算和样本排列标准。
方案设计首先要看两个案例:样本容量如何求高中
时间:如何求高中样本容量?
2022年度期刊何求高中样本容量?
GastroenterologyIF:19.819分
研究思路:
发现阶段1对360名受试者进行高通量代谢组检测,筛选出30种差异代谢物;发现阶段2对1594名受试者进行高通量检测,筛选出7种与发现阶段1共有的差异代谢物,然后通过二元逻辑回归分析得出2种潜在代谢物biomarker;对900名受试者(来自发现阶段2)进行建模阶段biomarker对1528名受试者进行靶向检测,并建立了诊断模型;验证阶段对1528名受试者进行2次biomarker靶向检测验证了模型的诊断效率。
时间:2022年期刊:GutIF:19.819分
在发现阶段,对92例受试者的血清进行了高通量代谢组检测,并选择了44例与血清相匹配的粪便样本进行宏基因组检测。经联合分析,确定322种与肠道微生物组相关的代谢物LASSO算法筛选和识别8种代谢物;72例正常个体和120例结直肠异常患者,用靶向方法测量8种代谢物的丰度,逻辑回归生成预测模型;103例结直肠异常患者和53例健康个体,评估了该模型的预测性能。通过以上两个经典案例,不难发现代谢组biomarker筛选过程通常包括三个阶段:①在发现阶段,通过高通量代谢组筛选候选人biomarker;②在建模阶段,通过靶向方法检测和筛选在建模队列中biomarker,并构建判别模型;③验证阶段在验证队列中靶向检测biomarker,验证模型判断效率。
那我们在代谢组文章中经常看到的发现集、训练集、验证集和测试集分别是指的哪个阶段呢?
这些词实际上来自机器学习的过程。在机器学习中,样本一般分为三个独立部分:训练集(trainset),验证集(validationset)和测试集(testset)。
培训集-用于模型拟合的数据样本。验证集-是模型培训过程中单独留下的样本集,可用于调整模型的超参数,初步评估模型的能力。测试集-用于评估最终模型的泛化能力。但不能作为与参数调整、选择特征等算法相关的选择依据。如果将这些概念映射到代谢标志物筛选过程中,发现阶段1中的人对应于培训集,有些文章也称为发现集;发现阶段2中的人对应于验证集;验证阶段的人对应于测试集;建模阶段的人可以来自验证集或测试集(独立于验证阶段的人)。
在明确了样本量估算的研究思路具体的样本数应该如何估算。
影响样本量计算的重要参数如下:
①研究设计类型(如横截面研究或随机对照研究)
②结局指标类型(二分类变量或连续变量)
③结局指标的预期值(敏感性或特异性或平均值)AUC)
④容许误差
检验水准α(通常取α=0.05)检验效能1-β(通常为80%或更高)Case组与control组的比例:control组的样本量一般不小于Case组的样本量,通常是等量的。
单样本临床诊断试验的样本量计算方法如下:
样本量按灵敏度和特异性计算
δ研究人员人为指定了允许的灵敏度或特异度95%的宽度,通常在0.03~0.1。
例如,将参数设置为:
特异度:90%±10%敏感度:80%±10%;显著水平(α)0.05;置信度(1-α):0.95;检验类型:two-sidedtest根据公式计算:
根据敏感性和特异性计算两个样本量值,选择较大的样本量。样本量为62例。
也可使用PASS直接计算软件:
计算所得样本量敏感度
特异度计算所得样本量
本例结果显示,通过敏感度计算所得N=70,收入由特异度计算N=44,选择数值较大的人需要70个研究对象。
PASS软件计算结果与公式计算结果略有偏差,可选择样本数大的结果,即所需样本数为70例,病例70例。
根据AUC样本量计算软件:MedCalc
预计AUC=0.9
检验水准α:0.05
检验效能1-β:0.9
无效假设:AUC=0.8
根据软件计算,样本量为82 82=164例。
在机器学习中,一般训练集、验证集和测试集的分割比为6:2:2。如果没有验证集,训练集和测试集的分割比为7:3,映射到代谢标志物筛选过程中,相应的建模队列和验证队列的比例为7:3。
样本纳排标准代谢组的结果容易受到环境等外部因素的影响,因此如果要筛选真阳性代谢biomarker,样品的入组条件需要严格限制。
样本纳入条件:
1.根据实验设计,随机选择符合分组要求的样本。
2.尽量保证与研究无关的临床指标,如年龄、性别等。
3.样品选择应尽可能具有时间和地域的随机性。
4.样品符合采样标准流程,相应的临床信息完整。
临床信息的收集如下表所示:
样品排除条件:
1.样本具有严重的急性感染;
2.样本贫血严重;
3.样本肝肾功能不全;
4.样本患有肿瘤或多个肿瘤;
5.妊娠期样本;
6.样本患有自身免疫缺陷疾病;
7.样本患有高脂血症和高黄疸。
上述排除条件仅适用于非本病的研究(即如果对妊娠期糖尿病进行相关研究,则不适用第除条件不适用)。如何找到24200325个高中设计图片的原始样本容量,包括如何找到高中图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《如何求高中样本容量(临床研究专题|如何计算样本容量)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/186692.html