㈠ 反映数据离散程度的特征数是( )A、中位数,众数和平均数B、中位数,方...
根据方差,极差和标准差的意义可得答案.方差反映数据的波动大小,即数据离散程度.解:由于方差,极差和标准差反映数据的波动情况,所以能够刻画一组数据离散程度的统计量是方差,极差和标准差.故选.此题主要考查统计的有关知识,主要包括平均数,中位数,众数,方差的意义.反映数据集中程度的统计量有平均数,中位数,众数方差等,各有局限性,因此要对统计量进行合理的选择和恰当的运用㈡ 离散程度的指标有哪些
离散程度的指标有极差,四分位数间距,标准差,方差,变异系数。
四分位数间距:是第75百分位数与第25百分位数之差,用符号Q表示,即Q=P75-P25.它反映了一组观察值按从小到大的顺序排列后,中间一半观察值的波动范围。四分位数间距常用于描述偏态分布资料,一端或两端无确切值或分布不明确资料的变异程度。
标准差:方差的单位是观察值原始单位的平方,在实际工作中使用不便,故将方差开算术平方根得到标准差。标准差是描述对称分布,特别是正态分布或近似正态分布资料变异程度的指标。
方差:描述对称分布,特别是正态分布或近似正态分布资料变异程度的指标。在实际工作中总体方差往往是未知的,常用样本方差来估计。
变异系数:亦称离散系数,简记为CV,为标准差与均数之比。极差、四分位数间距和标准差都有单位,且与观察值的原始单位相同;而变异系数为相对数,没有单位,便于计量单位不同或均数相差悬殊的多组资料间变异程度的比较。
㈢ 度量数据分散特性的指标有哪些
衡量数据离散程度的指标有:1.异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度
㈣ 什么是数据的离散程度常用的测度离散程度的指标有哪些
离散程度,外文名Measures of Dispersion,是指通过随机地观测变量各个取值之间的差异程度,用来衡量风险大小的指标。
指标:
1、极差
极差又称全距,是观测变量的最大取值与最小取值之间的离差,也就是观测变量的最大观测值与最小观测值之间的区间跨度。极差的计算公式为:R=Max(xi) −Min(xi)
2、平均差
平均差是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。
3、标准差
标准差是随机变量各个取值偏差平方的平均数的算术平方根,是最常用的反映随机变量分布离散程度的指标。标准差既可以根据样本数据计算,也可以根据观测变量的理论分布计算,分别称为样本标准差和总体标准差。
(4)反映数据离散程度特征数是什么扩展阅读
离散程度的测度意义:
1、通过对随机变量取值之间离散程度的测定,可以反映各个观测个体之间的差异大小,从而也就可以反映分布中心的指标对各个观测变量值代表性的高低。
2、通过对随机变量取值之间离散程度的测定,可以反映随机变量次数分布密度曲线的瘦俏或矮胖程度。
不常见的指标:
四分位数:是统计学中分位数的一种,即把所有数据由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数,其中,中位数是比较常用的评价指标。
(1)第一四分位数(Q1),又称“下四分位数”,等于该样本中所有数据由小到大排列后第25%的数据;
(2)第二四分位数(Q2),又称“中位数”,等于该样本中所有数据由小到大排列后第50%数据;
(3)第三四分位数(Q3),又称“上四分位数”,等于该样本中所有数据由小到大排列后第75%的数据;
(4)第三四分位数与第一四分位数的差距又称四分位距。
㈤ 平均数,中位数,众数,极差,方差,标准差各代表着什么
平均数:表示数据的总体水平。
中位数:表示数据的中等水平。
众数:表示数据的普遍情况。
方差、标准差:表示数据的离散程度,方差更能反映情况。
1、平均数是求几个数据的算术平均数。平均数是反映一组数据平均水平的特征数。平均数与一组数据里的每一个数据都有关系,平均数具有唯一性。
2、中位数是将一组数据按大小(或小大)顺序排列后,处在最中间的一个数(奇数个)(偶数个求最中间的两个数的平均数)。一组数据的中位数具有唯一性。
3、众数是一组数据中出现次数最多的数叫做这组数据的众数。一组数据的众数可以是一个或多个。众数着眼于对数据出现次数的分析,众数是描述一组数据集中趋势的统计量,不具有唯一性。
平均数、中位数、众数从不同的角度反映了一组数据的集中趋势,但他们是有区别和联系的,他们有可能是同一个数据。
极差是一组数据的最大值减去最小值所得的差叫极差。它是反映数据变化范围的。
方差是一组数据中各数据与它们的平均数的差的平方的平均数,我们把这个平均数叫做这组数据的方差。即来衡量这组数据的波动大小,一组数据的方差越大,说明这组数据的波动越大;方差越小,数据的波动越小。要比较数据的稳定性,一般会用到方差。方差比较全面地反映数据的离散程度。
标准差是将求出的方差开平方,即算术平方根。这个算术平方根,即称为这组数据的标准差。标准差也是用来表示一组数据的波动大小的量。和方差一样是衡量这组数据的波动大小。
㈥ 两类重要的特征数
常用的两类特征数是:表示数据集中程度的特征数,称为整体代表性特征数(或集中性参数);表示数据离散程度的特征数,称为离散性特征数。前一类中常用的有算术平均数、几何平均数、众数、中位数等。后一类中常用的有极差、方差、标准差、变化系数等。
(一)整体代表性特征数
算术平均数�x和几何平均数
[例8-1]安徽月山闪长岩体中Cu含量(10-6)比色分析结果及其对数值列于表8-2。试求其几何平均值。
解:根据表8-2中的数据直接使用公式(5-14),则未分组时
放射性勘探技术
分组数据的对数值的平均数为
放射性勘探技术
对上述数值取反对数,得未分组数据的几何平均数
表8-2 安徽月山闪长岩中Cu含量(10-6)及其常用对数值
1.众数M0
就是一批观测数据中出现机会最多的变量值,或者说是对应最大频数(频率)分布的变量值。如果是分组数据则可用图解法求出众数M0,在228个γ照射量率数据的频率直方图中(图8-3),最高长方形与相邻长方形有两个交点D和C,用AC及和BD交点,向x轴作垂线,交于M0点,M0点即为所求之众数。
图8-3 图解法求取众数
2.中位数Me
把一批观测数据按大小次序排列,用排在最中间的一个数来表示总体的平均水平,称为中位数。当数据为整数,且数据的个数为奇数时,正中间的数只有1个,这就是中位数;当数据的个数为偶数时,正中间的数据有2个,此时取2个数的平均值即为中位数。例如,2、3、6、7、9,则Me=6。而1、3、8、10、13、16,则中位数Me=(8+10)/2=9。
对于分组数据来说,中位数就是把频数(频率)分布直方图中总面积分为相等两半的变量值,或者说是累积频数为N/2的变量值(N为总频数)。计算中位数的公式如下:若数据分为n组,总频数为N,且第一组到第K组累积频数为N1,第1组到第K+1组的累计频数为N2,并满足N1≤N/2≤N2,则中位数
放射性勘探技术
式中:M——第K组的组上限;
l——组距;
[例8-2]求表8-1中228个γ照射量率数据的中位数。
解:N=228,N/2=114,K=4时,N1=3+14+30+47=94,则K+1=5,N2=3+14+30+47+52=146,此时满足N1≤N/2≤N2,M=33.5(第四组组上限),l=4,
放射性勘探技术
一批单峰分布数据的中位数Me,一般介于算术平均数
图8-4 负偏分布曲线(a)和正偏分布曲线(b)
(二)离散性特征数
只有整体代表性特征数,还不足以描述观测数据的分布特征。例如在一坑道的两个穿脉坑道中同时揭露到两条工业矿体。其中一条在四个坑壁上的矿体厚度分别为2.5m、0.5m、2.0m、0.2m,而另一条的矿体厚度分别为1.6m、0.9m、1.3m、1.4m,两条矿体的平均厚度都为1.3m。显然后一条矿体厚度变化比较稳定,易于开采,而前一条矿体厚度变化大,不易开采。因此数据波动的大小也是描述观测数据分布特征的一个重要参数。
1.极差R
一批观测数据中最大值与最小值之差,称极差,用R表示:
R=max{x1,x2,…,xn}-min{x1,x2,…,xn}(8-2)
式中:max{x1,x2,…,xn}——观测数据x1,x2,…,xn中的最大值;
min{x1,x2,…,xn}——观测数据x1,x2,…,xn中的最小值。
由于极差没有充分利用观测数据提供的信息,只依赖于两个极端值,因而本身很不稳定,反映实际情况的精度差。但它具有计算简便迅速的优点。
2.标准差s
标准差又称均方差、方根差等,用s记之。
设有n个观测值x1,x2,…,xn,其平均数为
放射性勘探技术
而把标准差s的平方称为方差,用s2记之,即
放射性勘探技术
对于分组数据则有
放射性勘探技术
式中:
xj——第j组的组中值。
标准差与方差的大小都反映了一批观测数据对其平均数的离散程度;s愈大,数据愈分散,s愈小,数据集中在
为了便于记忆和计算,标准差的公式可改写如下:
放射性勘探技术
式中:
可见标准差可由观测值平方的平均数减去观测值平均数的平方后再开方求得。
实际工作中当样本较小时(n<30),则标准差的公式为
放射性勘探技术
3.变化系数CV
一批观测数据的标准差与其平均数之比值称为变化系数(也称变异系数),记为CV:
放射性勘探技术
式(8-10)是一个量纲为一的数,是反映数据相对离散程度大小的特征数。
(三)偏度系数CS与峰度系数CE
偏度与峰度系数是描述分布曲线偏斜及陡峭程度的两个特征数。
假如有n个数据,分为k个组,每个组的组中值为xj(j=1,2,…,k),则
放射性勘探技术
式中:
当CS>0,分布为正偏,CS<0分布为负偏,CS=0,分布对称。
放射性勘探技术
式中:
当CE=0,分布与正态分布陡峭程度一样;CE>0,分布比正态分布要陡峭;CE<0,分布比正态分布平缓。