统计学的基本概念
一万年太长,只争朝夕
概率论主要研究随机变量的方法论和理论模型,统计学利用概率论研究随机现象(结果的不确定性)。研究这些随机现象最重要的方法是通过大量的重复试验找到统计规律。一般步骤是:统计中样本的概念
重复试验,记录试验结果,然后整理、分析和建模试验数据,最终预测和指导随机现象的一些规律。本部分简要总结了统计学中的一些基本概念。
1.1概率论与数理统计的异同
概率论和数理统计都是研究随机现象的统计规律学科,但研究角度不同。
概率论:统计中样本的概念
研究随机变量X数学特征、分布性质等。
数学统计:统计中样本的概念
研究对象X未知的分布需要通过分析样本数据来确定X服从什么分布来推断对象的整体规律。数学统计研究主要是通过推断样本信息的整体信息来完成的。
1.2总体与样本
顾名思义,整体是研究或调查对象的整体,整体中的每个成员都被称为个人。整体中包含的个人数量称为整体容量。在实践中,人们通常只关注一个(或几个)指标的整体,可以用一个或多个随机变量来表示它们。根据整体中包含的个分为有限的整体和无限的整体。
在实际应用中,为了研究整体特征,总是从整体中提取一些个体进行观察和测试,并根据观察或测试获得的数据推断整体性质。从整体中提取的一些个体称为样本。样本中包含的个人数量称为样本容量。观察或测试样本的过程称为抽样。从观察或测试中获得的数据称为样本观测值(样本值)。通常,容量是n样本用随机变量表示。
例如,假设学校所有男孩的身高都是随机变量X,为了研究X通过某种方式从学校的所有男生中找到100名,这100名男生是整体样本。
简单随机样本本:如果样本是完全随机的,相互独立和整体的X具有相同分布的样本来自整体X简单随机样本。简单随机样本的抽样称为简单随机抽样。
1.3统计量
样本中存在统计量的概念。统计量包含样本的所有信息。只要确定样本,就可以直接计算统计值。常用的统计量如下。
样本均值;
样本方差;
样品标准差;
样本k阶原点矩;
样本k阶中心矩。
样本平均值等于样本的一阶原点矩。
统计分布称为抽样分布。X服从一般分布(如指数分布、均匀分布等。),统计分布比较困难,但当整体分布时X服从正态分布时,可以计算统计量,服从一定的分布。本部分将介绍三种统计抽样分布-分布、分布和分布。我们常说的测试、测试和测试与这三种分布有关。
2.1分位数的概念
分位数是指将随机变量的概率分布范围分为几个等级的值点,以分析数据变量的趋势。分位数是在特定分布的概率密度函数曲线下的面积。常用的有中位数、四分位数、百分位数等。
假设连续随机变量的分布函数为,满足条件的称为或分布的四分位数。也就是说,对于概率密度函数,四分位点是将概率密度曲线下的面积分为四个部分。
上分位数:该值沿概率密度函数曲线下的面积x轴分为概率密度函数曲线和两部分x轴围成的面积等于。
对于概率密度函数曲线,其下面的区域是概率,因此上分位数不仅是该点右侧区域的区域,而且是在该分位数中获得所有大于该点的值的概率。在上图中,公式中和确定了两个值中的一个和另一个。
2.2分布
(1)定义:如果一个相互独立的随机变量服从标准正态分布(独立分布在标准正态分布中),那么这个服从标准正态分布的随机变量的平方,构成一个新的随机变量,其分布规律称为分布,自由度为,记录。
注:自由度是指独立随机变量的数量。
(2)性质:
设置,然后,分布的可加性:设置,相互独立,然后。这种性质可以推广到一个有限的随机变量。当它很大时,自由分布类似于正态分布。Python实现代码如下。
卡方分布对比不同参数,代码如下。
(3)上分位数的计算:按照上分位数定义,如果要计算的值,只需要计算即可。函数有两个参数,第一个是的值,第二个是。另一种计算方式是函数,该函数在值较小的情况下(的值在图像中比较靠右时),计算结果比函数更精确。代码示例:
函数也可以根据上分位数值计算对应值:
这里的值相当于假设检验中的值。
2.3分布
定义:服从标准正态分布,服从自由分布,相互独立,称为变量服从自由分布,记录。
特点:以0为中心,左右对称单峰分布;分布是一簇曲线,其形态变化与自由度有关。自由度越小,分布曲线越低;自由度越大,分布曲线越接近标准正态分布曲线。当自由度无限大时,分布变成正态分布,如图所示:
性质:设,则
当时,期望并不存在;
当时方差不存在。
分布的Python实现代码如下。
2.4分布
定义:设服从自由度为的分布,服从自由度为的分布,且、相互独立,则称变量所服从的分布为分布,其中第一自由度为,第二自由度为。
特点:一般来说,分布是右偏分布,但当自由度接近无限时,分布会接近正常分布。
,否则期望就不存在了。
,否则方差不存在。
,也就是说,分布的倒数也是分布(参数交换)。在99872086个原始统计中找到样本的概念设计图片,包括概念图片、材料、海报、证书背景和源文件PSD、PNG、JPG、AI、CDR等格式素材!
毕业证样本网创作《统计中样本的概念(统计学的基本概念)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/180910.html