数学概念样本(Bootstrapping数学定义)

摘要:
文章介绍了Bootstrap方法,一种基于观测样本的经验分布函数来估计分布特征的方法。文章详细阐述了Bootstrap方法的实质和计算步骤,包括通过产生Bootstrap样本、计算Bootstrap统计量的可能值以及估计参数的分布特征。通过三个例子说明了如何使用Bootstrap方法来估计中位数和均方误差的标准误差和偏差。此外,文章还提到了关于数学概念设计图片的相关素材。

算法工程师

遗憾的是,很多关于概率论和数理统计的书都不讲bootstrap。

数学概念样本(Bootstrapping数学定义)

设置随机样本是一个独立的相同分布样本,是一个预选的随机变量,是一个和谐函数。现在需要根据观测样本估计的分布特征。例如,设置为整体分布的参数是观测样本的经验分布函数,是的,估计误差为(1),Bootstrap方法的实质就是一个再抽样过程,计算分布特征的基本步骤归纳如下:数学概念样本

1)根据观测样本结构经验分布函数;2)从中提取样本称为Bootstrap样本;3)计算相应的Bootstrap表达式为(2)Bootstrap样本的经验分布函数;Bootstrap统计量;(注:数学概念样本

等号上的小三角表示定义)4)重复过程2)3次Bootstrap统计量的可能值;5)通过分布接近分布,即通过分布接近分布,可以获得参数的可能值,并计算参数的分布及其特征值。由Bootstrap可以看出,样本的数学概念

1)的统计特性是基于经验分布函数得到的,的统计特性是通过真实分布函数描述的;2)Bootstrap计算自助统计量的分布是方法的一个重要环节;3)Bootstrap该方法的核心思想是利用自助统计的统计特性来接近统计特性,因此,Bootstrap该方法的效果在很大程度上取决于该方法的相似性;4)从公式(1)可以看出,统计特征取决于和的统计特征。对于特定的分布,它是一个确定的值,因此统计特征取决于统计特征;5)由公式(2)和Bootstrap从方法的抽样过程中可以看出,统计特征类似于正态分布。因此,相似性主要取决于相似性。对于大样本,它与统计特征有很好的相似性。然而,两者之间的差异不容忽视,尤其是在极小的情况下。称为估计量的标准误差。

bootstrap样本1的bootstrap估计为

bootstrap样本2的bootstrap估计为

...

bootstrap样本B的bootstrap估计为

上式即为的bootstrap估计,其中。

例1某一基金的年回报率是具有分布函数的连续随机变量,未知,中位数为未知参数。现有以下数据(%):

18.29.512.021.110.2

以样本中位数作为总中位数的估计。试图估计中位数的标准误差bootstrap估计。

从小到大排序原样本,中间一个数12.0,样本中位数为12.0。

根据放回抽样的方法,在上述5个数据中相继独立取回以下10个数据bootstrap样本:

注:一般采用计算机取样,这里由于5、小,可使用随机数表(该数表含有大量伪随机数)进行取样,具体做法如下:原始样本的个体从左到右编号为1、2、3、4、5。需要产生分布律的5个随机数。为此,在随机数表中获得5个伪随机数0.215000.010110.474350.913120.12775因此,分布的5个随机数为2、1、3、5、1,因此得到相应的本题样本9.518.212.010.218.2这是这里的样本1。样本19.518.212.010.218.2

样本221.118.212.09.510.2

样本321.110.210.212.010.2

样本418.212.09.518.210.2

样本521.112.018.212.018.2

样本610.210.29.521.110.2

样本79.521.112.010.212.0

样本810.218.210.221.121.1

样本910.210.218.218.218.2

样本1018.210.218.210.210.2

对以上每个bootstrap样本中位数分别为样本

因此,以原样本确定的样本中位数作为总中位数的估计,其标准误差bootstrap估计为

在这个问题中,这只是为了解释计算方法,不能实际使用,实际应用。

假设数学期望是(表示分布函数时的数学期望)。

的估计为(表示以为分布函数时的数学期望)。

示例2(均方误差)金属元素铂的升华热是具有分布函数的连续随机变量,中位数为未知参数,现测量以下数据(见kcal/mol计):

136.3136.6135.8135.4134.7135.0134.1143.3147.8

148.8134.8135.2134.9149.5141.2135.4134.8135.8

以样本中位数作为总中位数的估计,试图平均误差bootstrap估计。

从小到大排序原样本,左起第13个数字135.0,左起第14个数为135.2,所以样本中位数是。135.1作为总中位数的估计,即。取,平均值需要估计。

独立抽取1万个bootstrap样本如下:

133.2134.1134.1134.1134.8134.8134.8134.9134.9134.9135.0135.2135.2135.4135.4135.8135.8136.3136.3136.6136.6141.2143.3143.3147.8148.8

样本中位数为135.3

样本10000

134.3134.5134.5134.5134.7134.8134.8134.8134.8134.8134.9134.9134.9134.9135.0135.4135.4135.4135.4135.4135.8136.6146.5146.5147.8148.8

样本中位数为134.9

用第一个样本计算

也就是样本1

对于样本10000

使用这1万个数字的平均值

近似,即得bootstrap估计为0.07。

例3(偏差)估计的偏差定义为。

在示例2中,以样本中位数作为总中位数的估计,寻求偏差bootstrap估计。

原始样本的中位数由示例2知道135.1。以135.1作为总中位数的估计。也就是说。取,需要估计的平均值。计算示例2中的第一个样本

对于样本1

偏差上述1万个数的平均值bootstrap估计为

请批评和纠正,谢谢~找到24490599个原始样本的数学概念设计图片,包括数学概念图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!

毕业证样本网创作《数学概念样本(Bootstrapping数学定义)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177739.html

(0)
上一篇 2022年4月28日
下一篇 2022年4月28日

相关推荐

  • 数学概念样本(Bootstrapping数学定义)

    摘要:
    文章介绍了Bootstrap方法,一种基于观测样本的经验分布函数来估计分布特征的方法。文章详细阐述了Bootstrap方法的实质和计算步骤,包括通过产生Bootstrap样本、计算Bootstrap统计量的可能值以及估计参数的分布特征。通过三个例子说明了如何使用Bootstrap方法来估计中位数和均方误差的标准误差和偏差。此外,文章还提到了关于数学概念设计图片的相关素材。

    2022年4月28日 上午9:25
    230
客服微信
客服微信
返回顶部