算法工程师
遗憾的是,很多关于概率论和数理统计的书都不讲bootstrap。
设置随机样本是一个独立的相同分布样本,是一个预选的随机变量,是一个和谐函数。现在需要根据观测样本估计的分布特征。例如,设置为整体分布的参数是观测样本的经验分布函数,是的,估计误差为(1),Bootstrap方法的实质就是一个再抽样过程,计算分布特征的基本步骤归纳如下:数学概念样本
1)根据观测样本结构经验分布函数;2)从中提取样本称为Bootstrap样本;3)计算相应的Bootstrap表达式为(2)Bootstrap样本的经验分布函数;Bootstrap统计量;(注:数学概念样本
等号上的小三角表示定义)4)重复过程2)3次Bootstrap统计量的可能值;5)通过分布接近分布,即通过分布接近分布,可以获得参数的可能值,并计算参数的分布及其特征值。由Bootstrap可以看出,样本的数学概念
1)的统计特性是基于经验分布函数得到的,的统计特性是通过真实分布函数描述的;2)Bootstrap计算自助统计量的分布是方法的一个重要环节;3)Bootstrap该方法的核心思想是利用自助统计的统计特性来接近统计特性,因此,Bootstrap该方法的效果在很大程度上取决于该方法的相似性;4)从公式(1)可以看出,统计特征取决于和的统计特征。对于特定的分布,它是一个确定的值,因此统计特征取决于统计特征;5)由公式(2)和Bootstrap从方法的抽样过程中可以看出,统计特征类似于正态分布。因此,相似性主要取决于相似性。对于大样本,它与统计特征有很好的相似性。然而,两者之间的差异不容忽视,尤其是在极小的情况下。称为估计量的标准误差。
bootstrap样本1的bootstrap估计为
bootstrap样本2的bootstrap估计为
...
bootstrap样本B的bootstrap估计为
上式即为的bootstrap估计,其中。
例1某一基金的年回报率是具有分布函数的连续随机变量,未知,中位数为未知参数。现有以下数据(%):
18.29.512.021.110.2
以样本中位数作为总中位数的估计。试图估计中位数的标准误差bootstrap估计。
从小到大排序原样本,中间一个数12.0,样本中位数为12.0。
根据放回抽样的方法,在上述5个数据中相继独立取回以下10个数据bootstrap样本:
注:一般采用计算机取样,这里由于5、小,可使用随机数表(该数表含有大量伪随机数)进行取样,具体做法如下:原始样本的个体从左到右编号为1、2、3、4、5。需要产生分布律的5个随机数。为此,在随机数表中获得5个伪随机数0.215000.010110.474350.913120.12775因此,分布的5个随机数为2、1、3、5、1,因此得到相应的本题样本9.518.212.010.218.2这是这里的样本1。样本19.518.212.010.218.2
样本221.118.212.09.510.2
样本321.110.210.212.010.2
样本418.212.09.518.210.2
样本521.112.018.212.018.2
样本610.210.29.521.110.2
样本79.521.112.010.212.0
样本810.218.210.221.121.1
样本910.210.218.218.218.2
样本1018.210.218.210.210.2
对以上每个bootstrap样本中位数分别为样本
因此,以原样本确定的样本中位数作为总中位数的估计,其标准误差bootstrap估计为
在这个问题中,这只是为了解释计算方法,不能实际使用,实际应用。
假设数学期望是(表示分布函数时的数学期望)。
的估计为(表示以为分布函数时的数学期望)。
示例2(均方误差)金属元素铂的升华热是具有分布函数的连续随机变量,中位数为未知参数,现测量以下数据(见kcal/mol计):
136.3136.6135.8135.4134.7135.0134.1143.3147.8
148.8134.8135.2134.9149.5141.2135.4134.8135.8
以样本中位数作为总中位数的估计,试图平均误差bootstrap估计。
从小到大排序原样本,左起第13个数字135.0,左起第14个数为135.2,所以样本中位数是。135.1作为总中位数的估计,即。取,平均值需要估计。
独立抽取1万个bootstrap样本如下:
133.2134.1134.1134.1134.8134.8134.8134.9134.9134.9135.0135.2135.2135.4135.4135.8135.8136.3136.3136.6136.6141.2143.3143.3147.8148.8
样本中位数为135.3
样本10000
134.3134.5134.5134.5134.7134.8134.8134.8134.8134.8134.9134.9134.9134.9135.0135.4135.4135.4135.4135.4135.8136.6146.5146.5147.8148.8
样本中位数为134.9
用第一个样本计算
也就是样本1
对于样本10000
使用这1万个数字的平均值
近似,即得bootstrap估计为0.07。
例3(偏差)估计的偏差定义为。
在示例2中,以样本中位数作为总中位数的估计,寻求偏差bootstrap估计。
原始样本的中位数由示例2知道135.1。以135.1作为总中位数的估计。也就是说。取,需要估计的平均值。计算示例2中的第一个样本
对于样本1
偏差上述1万个数的平均值bootstrap估计为
请批评和纠正,谢谢~找到24490599个原始样本的数学概念设计图片,包括数学概念图片、材料、海报、证书背景、源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《数学概念样本(Bootstrapping数学定义)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177739.html