数理统计第一讲(数理统计介绍及基本概念)
《不列颠百科全书》中提到,数学统计学是收集和分析数据的科学和艺术。如何理解这句话?这里要注意数学统计的双重性质。一是科学。数学统计不是一门完整的艺术艺术,很多都是严谨的数学推理,所以有时候我们会把它当成数学的一个分支,但我们应该强调它的艺术性,也就是说,数理统计不是纯粹的推理,这是它和数学的本质区别。同时也告诉我们,在学习数理统计的过程中,不能用教条式的态度,认为记住一些公式并应用是不对的。在运用数理统计解决实际问题时,不仅要注重科学性,还要注重艺术性。根据实际数据,根据当地情况采用不同的数理统计方法,有时使用哪种方法甚至来自灵感。
事实上,在收集和分析数据的科学和艺术之前,应该加上有效的方法这个词。在这里,有效的方法有三层含义。一是我们收集的数据应易于分析,结构应完整;二是采用统计方法,考虑人力物力的节约;第三,在选择统计方法时,不仅要保证方法的科学性,而且要使方法具有一定的精度。在第三章中,我们将学习一系列的评价标准,我们可以发现在不同的评价标准下,对同一参数的估计往往有不同的方法,这实际上是数学统计科学和艺术的体现。
此外,数学统计学研究的数据不同于我们认知中的数据。它研究随机数据。换句话说,这些数据可以通过概率来描述,即随机变量,这是它与其他处理数据的学科(如数值分析)的主要区别。
中国著名统计学家陈希儿院士说:数学统计学是数学的一个分支。它是一门以有效的方式收集和分析具有随机影响的数据的学科,其目的是解决具体问题。。陈希儿院士是一本了解数学统计发展历史的好书。
现在我们已经处于大数据时代,数据像潮水一样不断涌向我们。有人说统计就是生活,统计就是生活,也有人说统计就像柴、米、油、盐、酱、醋、茶一样,存在的时候不是很突出。一旦消失,生活就是黑白的。有人用过Google"搜索互联网的结果是,包括统计这个词的网页高达1万、1万、万,包括粮食这个词的网页有56、3万、万,前者是后者的60倍以上。这一结果表明,统计学目前非常流行。
统计研究包括抽样调查、回归分析、多元化统计分析、时间序列分析、数据挖掘、生存分析、深度学习等,数学统计作为大二专业课程,只介绍统计方法的基础知识,属于过渡课程。
什么是整体?如果你直观地理解,你必须有一个研究对象,对吧?你总是研究对象的某种性质,对吧?所以对象 的性质是整体的。例如,以浙江大学毕业证书为对象,以身高为性质,加起来是整体;以杭州灯泡厂生产的灯泡为对象,以寿命为性质,加起来也是整体。此外,如果对象数量有限(如浙江大学文凭全体学生),则称为有限整体;如果对象数量无限(如杭州灯泡厂生产的灯泡),则称为无限整体。
在数学统计中,我们认为它通常是随机变量,用大写字母或希腊字母表示,如(记住不要使用小写字母!记住不要使用小写字母!记住不要使用小写字母!
然而,如何理解整体是随机变量?我的理解是,它通常是一个随机变量,但它的随机性反映在个人身上。例如,以浙江大学毕业证书全体学生的身高为例,我们选择任何学生,其身高显然是随机的,并遵循一定的概率分布,即整体分布。
在数理统计中,什么是样本?
第一,对于同一个对象,一般可以不同。(这不明显吗?一个对象可以有很多个性。
第二,统计学的目的不是了解整体中的个体,而是了解整体分布。例如,一个班的平均成绩远高于二班,但很难说谁的成绩好。
第三,一般来说,我们很难准确地找到整体分布,除非整体有限,我们观察它,所以我们会提前得到某种形式的整体分布,这是下一个分布。
数学统计和概率论的一个很大的区别是,概率论研究的总体分布是完全已知的,在数学统计的实际应用中,我们研究的总体不能完全已知(否则不需要研究),所以对于这种信息不完整,我们经常假设整体分布,然后缩小整体分布的范围,使研究可行。以下是一些例子:在数学统计中什么是样本
例1是灯泡厂生产的灯泡的总寿命。实际上,根据经验,假设寿命服从指数分布等某种分布,即
这是一个未知的参数。只要确定,就会确定整体参数,对灯泡寿命的推断就会转化为正确的推断。整体分布是指数分布:数学统计中的样本是什么?
对于灯泡厂生产的灯泡,假设使用寿命超过3000小时为正品,并研究灯泡的次品率。示性变量可定义为:
我们可以假设整体来自两个分布族:
只要确定了二次品率,就确定了整体分布。因此,对灯泡二次品率的推断转化为正确的推断。
例3总体为对一真值为的物理量的一切测量结果。我们知道测量结果会受到随机因素干扰,经验表明测量结果可以表示成真值与随机误差的和:
随机误差可以看作是无限多个小误差的积累。大数定律告诉我们,它遵循正态分布,也就是说,它可以假设整体来自正态分布族
这样,我们对测量结果的推断就会转化为对参数的推断,只要确定了参数,就会确定整体分布。此外,如果我们能知道测量仪器的精度,然后得到随机误差的方差,那么分布的假设就可以缩小到
另外,如果我们对整体信息知之甚少,只知道它是连续分布还是二阶矩分布,那么整体分布族就会扩大到
如果整个分布族只包含有限的实际参数,那么我们称之为参数分布族,通常称之为
表示未知参数,表示参数的取值范围,常称为参数空间。相反,如果我们不能通过确定有限的参数来获得整体的确切分布,那么我们称整体分布为非参数分布。例1、例2、例3中的总体来自参数分布,非参数分布。
对于总体研究,我们可以进行全面的调查,如人口普查,其优点是可以非常准确地得到整体分布,但缺点是需要大量的人力和物质资源。因此,在实际应用中,我们通常使用抽样调查的方法,即从整体中提取一些个体,并使用这些个体来代表整体。从整体中提取的一些个体被称为样本。根据某些规则提取一组样本的过程称为抽样。样本中的个人数量称为样本容量。
小心你可能已经发现,对于一组样本,它也满足了物体 的性质吗?例如,在浙江大学毕业证书的所有学生中,选择100名学生作为样本来研究他们的身高,那么它可以被视为浙江大学毕业证书的所有学生中的100名学生的身高吗?这样,样本实际上是一个整体的大个体,我们说整体的随机性反映在个体上,所以样本作为一个整体的大个体,当然,也有随机性,是一个随机变量,但其维度等于样本容量。
这样,我们就引出了样本的双重性。从整体上提取容量为的样本。在提取样本之前,我们不知道哪组个体会被提取。此时,样本是随机变量,但一旦我们提取并观察,我们将获得样本的观测值,这是样本中维随机变量的实现。我们称之为容量样本和样本观测值。我们将样本空间定义为样本所有可能值的集合。
例如,从总体上提取一个容量为3的样本,样本空间为
抽样方法有上千种,但我们最常用的是简单随机抽样,具有以下两种性质:
代表性:每个个体的整体机会都是平等的。
独立性:样本中每个个体的值不受其他个体值的影响。
一组通过简单随机抽样获得的整体样本是,根据代表性,由于每个人都有平等的机会被抽样,样本中的每个重量都与整体分布相同,然后分布相同。通过独立性,我们可以相互独立。另一方面,对于一组整体样本,如果它们满足了独立和相同的分布,那么这组样本被称为简单和随机的样本。
如果整体服从的分布是,那么简单随机样本的联合分布是
说明:在韦来生老师的数学统计中,分布函数是左连续的,即
类似地,如果总分布列或概率密度函数是,那么简单随机样本的联合分布列或联合概率密度函数是
显然,放回抽样是一种简单的随机抽样。对于无限总体来说,无放回抽样也是一种简单的随机抽样,对于有限的总体来说,无放回抽样一般不是简单的随机抽样,但当个人数量相对于样本容量非常大时,可以认为无放回抽样也是一种简单的随机抽样。
三连三离总体或回顾
Poisson分布
例题设定了指数分布的总体服从预期,为一组来自整体的简单随机样本提供联合密度函数。
总密度函数为
从简单随机样本的性质中,我们可以找到57523673个原创的样本设计图片,包括数学统计中样本图片、材料、海报、证书背景和源文件,包括PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《什么是数理统计中的样本(数理统计第一讲(数理统计介绍及基本概念)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/183092.html