回归分析中最小样本容量的确定-计算临床试验样本量
从事医疗器械、体外诊断试剂注册多年
回归分析中最小样本容量的确定
马赞甫a,刘妍珊b(贵州财经大学毕业证书)a.贵州经济系统模拟重点实验室;b.贵阳550025数学与统计学院
摘要∶样本容量影响回归方程的稳定性量影响回归方程的稳定性。考虑到样本回归方程的稳定性表示残余平方和的相对稳定性,从而构建服从贝塔分布或F分布的统计量以确定最小样本容量。
关键词∶回归分析;样本容量;残差平方和;贝塔分布;F分布
由于估计和预测的准确性,假设测试的可靠性,一般的数学统计教程系统地分析了最小样本容量的确定。本文与现有研究的起点略有不同,重点关注回归方程的稳定性。本文认为,最低样本容量应能够在一定程度上保证样本回归方程的相对稳定性。基于此考虑,本文用残余平方和的相对稳定性来表示回归方程的稳定性,从而构建估计的统计量来确定样本容量的最小值。
1贝塔统计量和最小样本容量
回归分析侧重于调查解释变量对给定解释变量期望值的影响,其影响的整体效果或模型拟合优度的一般表征决定系数(CoefficientofDetermination)这一指标,而决定系数则主要取决于模型残差平方和(ResidualSumofSquares,RSS)相对值。在不同样本下RSS在对稳定性在一定意义上反映了回归模型设置的合理性。p样本容量为个解释变量n,相应的回归模型是∶
如果回归结果良好,样本回归方程应相对稳定,RSS样本容量的变化不应有较大的波动。本文考虑将原样本分为两个子样本,其容量分别为q及n-g,具体来说,令∶
子回归模型也确定了一个RSS,在给定样本容量下,如果样本方程相对稳定,则相应RSS也相对稳定。考虑到子回归模型RSS不可能大于原回归模型RSS,本文需要两个模型RSS之比值∶
概率稳定性。
考虑到残余平方和系统是由有效样本产生的,有效样本应排除参数数。当回归方程稳定时,子样本产生的残余平方与样本产生的残余平方成一定比例。事实上,在经典假设下,残余平方和期望总是与有效样本容量成固定比例。因此,本文希望以下概率不等式建立,以表示样本回归方程的稳定性∶
也就是说,概率不等式(5)需要统计B在平均值附近波动。考虑到中心极限定理,样本容量n在足够大的情况下,概率不等式(5)没有实际意义。因此,样本容量的最小值应考虑以下优化问题来确定∶
为了简单起见,可以考虑根据样本容量增加1时RSS确定最小样本容量的稳定性,即样本容量为q=n-1,此时统计量
2利用F确定最小样本容量
在日常应用中,F统计比贝塔分布更方便,考虑以下几点F统计估计最小样本容量。在前面的定义下,显然有∶
为了估计相对稳定的样本回归方程,设置回归方程包含4个解释变量。g=n-1此时估计统计的子样本F服从分布F(1,n-5)。若取相对误差ε=0.05,样本容量n=41时区间概率值的时间为∶
此外,随着样本容量的增加,区间概率值累增。因此,如果小概率是α=0.10,最低样本容量为41;如果取样α=0.05,则最低样本容量当为64;若取α=0.01,最低样本容量为120。显然,最小样本容量对信心水平的设置很敏感。
计算结果完全可程式化,只针对相对误差ε确定有效样本容量n-p可以。表1是相对误差。ε设定在0.01~0.10有效的样本容量在条件下n-p区间概率值是最小值的参考标准EXCEL公式FDIST精确到小数点后三位数。
表1所反映的以下结论显而易见。如果样本回归方程要求具有较高的概率稳定性、较小的误差和较高的显著性,则模型的参数估计取决于较大的样本容量。
本文着眼于样本回归方程的稳定性RSS从相对误差开始,使用贝塔统计和F统计讨论了回归分析中最小样本容量的确定,并给出了有效样本容量的简单参考标准。本文的研究结果也保证了回归分析中卡方分布、学生分布和F分布的自由度有利于对解释变量的显著性测试以及对解释变量期望值和个别值的预测。找到48715668个原始样本容量的确定公式设计图片,包括样本容量的确定公式图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《样本容量的确定公式(回归分析中最小样本容量的确定-计算临床试验样本量)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177796.html