导航:首页 > 数据处理 > 数据呈对称分布有哪些

数据呈对称分布有哪些

发布时间:2023-10-07 08:36:58

① 数据分布的描述

数据的分布描述简单可以概括为集中趋势、离散程度以及分布形状等

一、集中趋势描述的优劣比较

1.平均数

也称为均值,常用的统计量之一

消除了观测值的随机波动

易受极端值的影响

数学性质优良,实际中最常用

数据对称分布或接近对称分布时代表性较好

2.中位数

排序后处于中间位置上的值。不受极端值影响

数据分布偏斜程度较大时代表性接好

3. 四分位数

排序后处于25%和75%位置上的值

不受极端值的影响

4. 众数

一组数据中出现次数最多的变量值

适合于数据量较多时使用

不受极端值的影响

具有不惟一性,一组数据可能没有众数或有几个众数

数据分布偏斜程度较大且有明显峰值时代表性较好

二、离散程度的描述

1.极差

一组数据的最大值与最小值之差

离散程度的最简单测度值

易受极端值影响

未考虑数据的分布

2.四分位差

也称为内距或四分间距

上四分位数与下四分位数之差

反映了中间50%数据的离散程度

不受极端值的影响

用于衡量中位数的代表性

3.方差与标准差

数据离散程度的最常用测度值

反映各变量值与均值的平均差异

根据总体数据计算的,称为总体方差(标准差)

根据样本数据计算的,称为样本方差(标准差)

4.离差

每个观测值与均值的差异

5.标准分数

计算方式为(原始数据-均值)/标准差

对某一个值在一组数据中相对位置的度量

可用于判断一组数据是否有离群点

用于对变量的标准化处理

均值等于0

方差等于1

只是将原始数据进行了线性变换,没有改变某个数据在该组数据中的位置,也没有改变该组数分布的形状

6.离散系数

标准差与其相应的均值之比

消除了数据水平高低和计量单位的影响

用于对不同组别数据离散程度的比较

解释需要谨慎,特别对于平均值趋近于0的样本,此时敏感度较大

没有置信区间

7.异众比率

非众数组的频数占总频数的比率

衡量众数对一组数据的代表程度,异众比率越高大,说明非众数组占总频数的比重越大,众数的代表性越差

三、数据分布性状的描述

偏态与峰态测量的是数据的形状,如是否对称、偏斜的程度以及扁平的程度

1.偏态

测度统计量是偏态系数

偏态系数=0为对称分布;>0为右偏分布;<0为左偏分布

偏态系数大于1或小于-1,为高度偏态分布

偏态系数在0.5~1或-1~-0.5之间,是中等偏态分布

偏态系数越接近0,偏斜程度就越低

2.峰态

测度统计量是峰态系数

峰态系数=0扁平峰度适中

峰态系数<0为扁平分布

峰态系数>0为尖峰分布

数据分析2-频数分布

频数分布的定义:在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为频数分布。又称 分布数列 。分布数列包括两个要素:总体按其标志所分的组和各组所分布的单位数。

统计分布是统计分析结果的一种重要表现形式,也是统计分析的一种重要方法。由于在描述性统计时、只用平均值、方差等统计时会产生数据的信息缺失、需要一些其他方法来表示样本的实际状况。由于其分布概率分布近似、通常可以用来推断数列的分布情况。

社会经济现象总体的性质不同,其次数分布的特征也不同。各种社会经济现象总体的次数分布,归纳起来主要有 钟型分布 U型分布 J型分布 洛伦兹分布 四种类型。

钟型分布是正态分布的俗称,其特征是“中间高,两头低”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,形如古钟

在社会经济现象中,钟型分布多表现为对称分布。对称分布的特征是中间的变量值分布的次数最多,以标志变量中心为对称轴。两侧变量值分布的次数随着与中心变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布。这种分布在统计学中称为 正态 分布 。在社会经济现象中,许多变量的分布近似于正态分布类型。

靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形成“两头高,中间低”的U字型分布。

在社会经济现象中,次数随着变量值的增加而增加,即J形分布。

在社会经济现象中,次数随着变量值的增加而减少,即J型分布。

洛伦兹分布曲线是美国统计学家洛伦兹( M.Lorenz)提出来的,专门用以研究社会收入分配的平等问题。

横轴OH表示人口的累计百分仿李比,纵轴OM表示收入的累计百分比,升大运弧线OL为洛伦兹曲线。洛伦兹曲线的弯曲程度有着重要的意义,它反映了收入分配的不平等程度。弯曲程度越大,收人分配越不平等,反之亦然。

洛伦弦曲线与对角线之间的部分A 叫做“ 不平等面积 ”,直角三角形OHL的面积(A+B)叫做“ 完全不平等面积 ”。不平等面积与完全不平等面积之比,就是 基尼系数 ,也称 集中系数 :基尼系数= A/(A+B)

基尼吵梁系数等于1,表示收人分配绝对不平等;基尼系数等于0,表示收人分配绝对平等。基尼系数是衡量,一个国家或地区贫富差距的标准之一。按照联合国有关组织规定:基尼系数若低于0.2表示收人平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收人差距较大;0.5 以上表示收人差距悬殊。通常把0.4作为收人分配差距的“警戒线”。发达国家的基尼系数在0.26-0.38 之间,我国2013年全国居民收人的基尼系数为0.473。

阅读全文

与数据呈对称分布有哪些相关的资料

热点内容
古董交易怎么算价格 浏览:152
美团热销产品买不了是什么原因 浏览:597
学汽车技术哪个专业比较好 浏览:78
五爱市场是哪个部门提出建设 浏览:207
曹庄子市场怎么去 浏览:778
抖音的大数据怎么看 浏览:611
报到证怎么交到人才市场 浏览:627
哪里有新市场开场开发 浏览:337
宝叶生物技术怎么样 浏览:15
电话手表如何查看微信信息 浏览:99
海鲜批发市场扇贝丁为什么没有鲜甜味道 浏览:531
手机插上电脑怎么没有驱动程序 浏览:593
程序员那么可爱一集多少时间 浏览:307
个人财务代理记账多少钱 浏览:595
市场服务科怎么能减少调整计划 浏览:944
想找个便民市场太原哪里有 浏览:654
去华东城水果市场怎么走更近 浏览:469
代理水果没有季节性水果怎么办 浏览:569
淘宝铜钱怎么交易 浏览:232
三菱m70系统如何看剩余程序 浏览:564