统计名词解释
1.统计学
统计学(statistics):统计学中样本的名词解释
科学地收集、处理、分析、解释数据并从数据中得出结论。
2.描述统计
(descriptivestatistics):统计学中样本的名词解释
统计学方法研究数据收集、处理和描述。
3.推断统计
(inferentialstatistics):统计学中样本的名词解释
研究如何利用样本数据推断总体特征的统计方法。
4.分类数据
分类数据(categoricaldata)反映事物类型的数据是根据现象的某些属性进行分类或分组获得的,也称为分类数据。
5.顺序数据
顺序数据(rankdata)非数字数据只能归类为某一有序类别。
6.数值型数据
7.观测数据
观测数据,又称原始数据,是指在自然不受控制的情况下观测到的数据。
8.实验数据
实验数据(experimentdata)指控制实验对象在实验中收集的变量数据。
9.截面数据
截面数据(cross-sectionaldatasets)它是不同主体在同一时间点或同一时间段的数据,也称为静态数据
10.时间序列数据
时间序列数据(timeseriesdata)是在不同时间收集的数据,按时间顺序收集,用于随时间变化描述的现象。
11.总体
又称母全体、全域,是指具有一定特征的一类事物
12.样本
从整体中提取的部分个体称为整体样本
13.样本量
样本量是指从整体中提取的样本元素的总数
14.参数
如果我们引入一个或其他变量来描述自变量和因变量的变化,引入的变量不是当前问题必须研究的变量,我们称之为参变量或参数。
15.统计量
样本结构函数从整体中提取,不含任何未知参数,则该函数为统计量。
16.分类变量
分类变量(categoricalvariable)它是一个描述事物类别的名称,其值是分类数据。
17.顺序变量
只显示数量和数量的变量。
18.数值型变量
数值型变量(metricvariable)它是一个描述事物数字特征的名称,其值是数值数据。
19.连续随机变量
连续随机变量是指如果随机变量X所有可能的值不能一一列出,而是取数轴上某一范围内的任何随机变量。
20.离散随机变量
当随机变量的可取值全体为一离散集时称其为离散随机变量
21.二手数据
与原始数据相比,二手数据是指为其他目的收集的统计数据,而不是正在进行的研究。与原始数据相比,二手数据具有获取速度快、成本低、易于获取、为进一步收集原始数据奠定基础等优点。
22.概率抽样
概率抽样是指每个单位在调查整体样本时都有同样的机会被抽样。
23.非概率抽样
是指调查人员根据自己的方便或主观判断抽样的方法。主要有主观抽样、滚雪球抽样等类型。
24.抽样框
抽样框,又称抽样框架和抽样结构,是指能够选择作为样本的列出名册或排序号,以确定抽样的整体范围和结构。
25.抽样简单随机
抽样简单随机也称为、纯随机抽样、SRS抽样是指从整体出发N任意抽取单位n作为一种抽样方法,每个可能的样本被抽样。
26.分层抽样
它是一种从不同层中随机抽取(个体)的方法,可以分为不同层(或层)。该方法的优点是具有良好的代表性和相对较小的代表性。缺点是抽样程序更复杂。其中一种优秀的方法经常用于调查。
27.整群抽样
组抽样是指对抽样组织进行全面调查的抽样组织方式。
28.系统抽样
先将总体的全部单元按照一定顺序排列,采用抽样简单随机抽取第一个样本单元(或称为随机起点),再顺序抽取其余的样本单元,这类抽样方法被称为等距抽样(SystematicSampling)。
29.多阶段抽样
多阶段抽样(Multistagesampling):是指抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即各种抽样方法结合使用,常用于大规模。
30.方便抽样
方便抽样,又称随机抽样和偶然抽样,是一种非概率抽样方法,由调查人员在特定时间和特定社区的某非概率抽样方法。
31.判断抽样
判断抽样,又称立意抽样,是指根据调查人员的主观经验,从整体样本中选择最能代表整体的单位。
32.自愿样本
自愿样本是指被调查人员自愿参与,成为样本的一部分,并向调查人员提供相关信息。
33.滚雪球抽样
滚雪球抽样是指随机选择一些受访者并访问他们,然后要求他们提供其他研究目标的整体调查对象,并根据形成的线索选择后续调查对象。滚雪球抽样通常用于调查稀有群体。在雪球抽样中,首先选择一组调查单位进行调查,然后要求他们提供其他研究对象,调查人员根据提供的线索进行后续调查。
34.配额抽样
配额抽样,又称,是指调查人员根据一定的标志对调查的整体样本进行分类或分层,确定各(层)单位的样本金额,并随意选择样本。
35.自填式
自填式是指被调查人员在没有调查人员协助的情况下填写并完成问卷。
36.面访式
面试是指调查人员在现场调查中与被调查人员面对面提问,被调查人员回答的调查方法
37.电话式
电话式是指调查人员通过打电话的方式向被调查者实施调查。
38.抽样误差
抽样误差是指由于随机抽样的意外因素,各单位的结构不足以代表各单位的整体结构,导致抽样指标与整体指标之间的绝对差异。必须指出的是,抽样误差不同于登记误差。注册误差是由观察、注册、测量和计算误差引起的,可能发生在所有统计调查中。抽样误差不是由调查误差引起的,而是由随机抽样引起的。
39.抽样框误差
抽样框误差是由不准确或不完整的抽样框引起的。从包含抽样误差的抽样框中提取的样品有时不能正确代表研究目标的实际情况,导致抽样框误差。
40.回答误差
答案误差是指被调查人员在接受调查时给出的答案与实际情况不一致,导致理解误差、记忆误差、有意识误差的原因
41.无回答误差
所谓无回答错误,是指数据丢失。数据丢失有两个原因,一个是有意不回答,另一个是无意不回答。有意识地不回答,主要是指被调查人拒绝访问或拒绝回答某个问题。无意识地不回答,受访者可能不在家或访问者的疏忽,导致数据遗漏。
42.调查员误差
调查人员误差是指调查人员造成的调查误差。
43.测量误差
测量时,实际值之间的差值称为误差。
44.预处理数据
数据预处理(datapreprocessing)是指在主要处理之前对数据进行的一些处理。
45.数据审核
数据审查是指在数据整理前对原始数据进行审查和核对。
46.数据筛选
数据筛选的目的是提高以前收集和存储的相关数据的可用性,更有利于以后的数据分析。数据筛选包括三个部分:数据提取、数据清理和数据加载。
47.数据排序
数据排序是按照一定的顺序排列数据,让研究人员通过浏览数据找到一些明显的特征或趋势,找到解决问题的线索。
48.数据分组
根据统计研究的需要,按照一定的标准将原始数据划分为不同的组,分组后的数据称为分组数据。
49.异众比率
异众比率(variationratio)它是统计学术语,是统计学中研究现象离中趋势的指标之一。异众比率是指非众数次数与整体次数之比。换句话说,异众比率是指非众数组占总频率的比例。
50.四分位差
四分位差反映中间数据的50%,数值越小,中间数据越集中;数值越大,中间数据越分散。
51.标准分数
它是将原始分数与团体的之差除以所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个,或是在平均数之下多少个标准差。
52.离散系数
离散系数,又称变异系数,是统计中常用的统计指标。离散系数是测量数据离散程度的相对统计,主要用于比较不同样本数据的离散程度。离散系数大,数据离散程度大;离散系数小,数据离散程度小。
53.68%、95%、99%的经验规则
54.切比雪夫不等式75%、89%、94%
55.偏态系数
偏差系数用平与之差对比来衡量偏差程度SK表示偏差系数:偏差系数小于0,因为平均值约为众数,是左偏分布,也称为负偏。偏差系数大于0,因为平均值约为众数,是右偏分布,也称为正偏分布。
56.峰态系数
K尖峰分布大于0,K小于0,平分布
57.古典定义概率
如果随机试验结果有限且可能性相等,则某一事件发生的概率为基本事件数/样本空间包含基本事件数。
58.概率统计定义
在相同条件下随机试验N二、某事件发生m二是比值事件的概率。
59.样本矩
一种常用的统计量是模拟整体数字特征结构的样本数字特征,称为样本矩。样本矩主要包括样本平均值、未修正样本方差、样本(修正)方差、样本k阶原点矩和样本k阶中心距。
60.抽样分布
抽样分布,又称统计量分布和随机变量函数分布,是指样本估计量的分布。样本估计量是样本的函数,在统计学中称为统计量,因此抽样分布也指统计量的分布。
61.中心极限定理
设随机变量X1,X2...Xn...独立分布,数学期望:E(Xi)=μ,D(Xi)=σ20(k=1,2...),则对任意x,分布函数
定理说明,当n随机变量很大
近似地服从标准的正常分布N(0,1)n很大时,
服从正态分布近似N(nμ,nσ2)定理是中心极限
定理最简单又最常用的一种形式,在实际工作中,只要n足够大,便可以把独立同分布的随机变量之和当作正态变量。这种方法在数理统计中用得很普遍,当处理大样本时,它是重要工具。[2]
{n}
62.估计量
{n}
估计量用来估计未知总体的参数
{n}
毕业证样本网创作《样本的名词解释(统计名词解释)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/176944.html