计算样本量的公式(指南解读系列|BMJ)

摘要:本文介绍了如何计算临床预测模型的样本量,包括模型开发、验证和内部验证的样本量估计。文章以四个步骤引导样本量估计,每一步都能得到样本量结果,最终取最大值。文章强调准确估计样本量是临床试验可靠性和可重复性的重要保证,并结合具体研究情况判断样本量。同时,介绍了减少过拟合问题的处理方法。此外,文章还提供了相关的素材和图片等参考内容。

指南解读系列|BMJ:计算样本量的公式

计算临床预测模型样本量的四个步骤

计算样本量的公式(指南解读系列|BMJ)

关于临床预测模型,我们分享了如何构建临床预测模型(点击回顾):计算样本量的公式

样本量本量的内容包括:计算样本量的公式

根据不同的研究目的,临床预测模型需要足够的样本量:

1)预测因素效应研究:

根据预期效应量(如OR、HR)、样本量计算预测因素和事件发生率;

2)模型开发:

3)模型验证:

单级模型:至少100个事件;

多层次模型:>50组(每组50名受试者)

准确估计样本量是临床试验可靠性和可重复性的重要保证,今天的指南解读系列也将基于BMJ,分享临床预测模型样本估计中需要注意的问题,减少计算预测模型样本大小时的混乱。

以二分类结果的研究为例,根据以往的经验,我们通常认为每个变量至少需要包括10个事件,这是一个被广泛接受的默认规则(也称为10EPV”,10eventspervariable)。但事实上,一些预测因素会产生两个或多个β多个变量之间的相互作用也会增加模型参数的数量,因此预测模型通常需要更多的参数。10EPV目前还没有定论的改进建议,还需要结合具体研究情况进行具体判断。

理想情况下,模型开发的样本量越大越好。然而,考虑到研究效率和成本等实际问题,需要估计能够同时支持有效性和安全性的最高样本量。

此外,作者强调,不建议将数据分为模型培训和测试样本,而是使用所有数据进行内部验证(本指南不适用于外部验证)。

本文主要从四个步骤引导样本量估计,每一步都能得到样本量结果,最终取最大值:

从根本上说,样本尺寸必须能够准确估计预测模型的截距,以确保开发的模型能够准确预测平均结果值或结果的整体比例。因此,最直接的方法是准确估计模型截距(空模型)所需的样本量。

比如二分类结局,n样本量大小,有结局事件的比例(φ)95%的信心范围:

绝对误差范围(δ)为:

样本量计算公式如下:

模型开发所需的样本量也需要满足准确预测预测值范围的要求。vanSmeden等人[4]认为总样本的大小和结局事件的比例是模型平均预测精度的三个主要因素(asmeasuredbythemeanabsolutepredictionerror,MAPE)的公式:

其中n样本量大小,φ为预期结局事件的比例(≤0.5),P为预测变量的数量。

减少过拟合对模型的预测性能非常重要。当样本量太小或模型性能太好时,应特别注意检查此问题。通过减少开发模型的预测可变性,即减少极端预测(如预测概率接近0或1),可以处理过拟合问题。

Riley等人[5][6]建议在开发模型时注意较小的收缩率(≤0.1,即预期收缩因子S≥0.9)下确定样本量和预测变量的数量。

比如二分类结局,R(cs)^2保守指标是评估模型性能Cox-SnellR^2,它反映了模型的噪声比,可以影响多参数估计和模型潜在过拟合(近0时,考虑到参数估计不可靠,过拟合;接近1时,反之亦然)。

4样本量是否保证开发模型和样本量R(cs)^2优化调整值差异小?

这里的“R(cs)^2优化调整值指R(cs)^2/max(R(cs)^2),它是目标人群中模型拟合度的无偏估计。

例如对于二分类结局,收缩因子公式为(建议δ≤0.05):

(详见指南原文[1]。

[1]EnsorJ,HarrellFE,ReitsmaJB,etal.Calculatingthesamplesizerequiredfordevelopingaclinicalpredictionmodel[J].RMDOpen,2022,368:-.

[3]时景璞.在临床研究中,样本量的估计方法[J].(10)中国组织工程研究:1569-1571.

[4]vanSmedenM,MoonsKG,deGrootJA,etal.Samplesizeforbinarylogisticprediction

models:Beyondeventspervariablecriteria.StatMethodsMedRes2022;28:2455-74.

10.1177/.29966490

[5]RileyRD,SnellKI,EnsorJ,etal.Minimumsamplesizefordevelopingamultivariable

predictionmodel:PARTII-binaryandtime-to-eventoutcomes.StatMed2022;38:1276-96.

10.1002/sim.

[6]VanHouwelingenJC,LeCessieS.Predictivevalueofstatisticalmodels.StatMed

1990;9:1303-25.10.1002/sim.

地址:广州市天河区珠江东路高德置地秋广场F座位找到了45368158个原始计算样本量的公式设计图片,包括计算样本量的公式图片、材料、海报、证书背景和源文件PSD、PNG、JPG、AI、CDR等格式素材!

毕业证样本网创作《计算样本量的公式(指南解读系列|BMJ)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/180394.html

(0)
上一篇 2022年4月29日
下一篇 2022年4月29日

相关推荐

  • 验证方案样本量怎么选择

    摘要:

    文章讨论了验证计划样本量的挑选方法,涉及整体方差和样本股票的选取。由于上市股票种类繁多,为简化核算工作,人们选择具有代表性的样本股票进行价格平均数和指数的核算。挑选样本股票时需考虑职业分布、影响力、股票等级和数量等因素。股价指数的代表性重要,需选择不同职业中具有典型性的股票。整体方差与样本量无必然联系,而与样本异质性相关。样本异质性高时,方差大;同质性高时,方差小。关于样本量的选择,当样本量达到一定程度时,样本方差会接近整体方差。

    2022年6月17日
    280
  • 为什么样本不能低于30(为什么 30 样本被称为「大样本」)

    摘要:本文解释了为什么样本数通常设定为至少30个,涉及预测精度、统计规律、样本容量与预测误差的关系等方面。文章指出,样本数的决定取决于预测的精度,小概率事件在30个样本中不一定发生,而样本容量小于30时仍可使用t检查。为了获得准确的本质概率,需要足够的样本数。文章还介绍了样本量的计算方法和分配方式,强调了样本量与总体尺寸的关系,并指出样本量并非越大越好。总体上,样本尺寸与预期的预测精度和总体尺寸有关,为了保证一定的预测精度和置信度,通常认为至少需要30个样本数。

    2022年4月29日
    270
  • 样本量确定方法(问卷调查方法-如何确定样本量)

    摘要:问卷调查中样本量的确定没有绝对标准,取决于研究方法、目的、要求及材料等因素。科学地确定样本量能提高研究可靠性。样本量受资料性质、事件发生率、有效率的研究因素、显著性水平、检验效能、容许的误差和总体标准差等影响。在问卷调查中,需要综合考虑这些因素来合理确定样本量。

    2022年4月29日
    250
  • 样本量计算公式最简单(nQuery小班|计算临床试验样本量的5个步骤)

    摘要:文章讨论了在进行研究时如何确定样本量,考虑了研究成本限制和预期的脱落率。通过一个计算样本量的例子,解释了如何调整样本量以应对预期的脱落情况。最后提及了nQuery是一个临床试验设计软件平台,其有助于高效设计临床试验并降低风险和成本。该平台受到生物统计学家和监督批准的研究人员的青睐,并为中国用户提供了特色采购渠道。

    2022年4月29日
    270
  • 计算样本量的软件(Gpower使用秘籍-样本量计算

    摘要:本文介绍了计算样本量的相关统计概念,包括假设检验中的原假设和虚无假设、Ⅰ型错误和Ⅱ型错误等。文章重点介绍了GPOWER软件的功能和使用方法,包括先验分析和事后分析,以及如何选择合适的统计方法来估计样本量。文章旨在帮助读者解决样本量问题,通过可视化工具理解统计概念,顺利使用GPOWER软件估计样本量。同时,文章还提供了相关的素材和图片资源。

    2022年4月30日
    240
客服微信
客服微信
返回顶部