文档章节

mode|平均数|方差|标准差|变异系数|四分位数|几何平均数|异众比率|偏态|峰态

o
 osc_isezqdgg
发布于 2019/09/18 15:07
字数 776
阅读 40
收藏 0

精选30+云产品,助力企业轻松上云!>>>

应用统计学

数据的概括性度量

集中趋势

Mode众数是唯一描述无序类别数据,由图可知众数便是图形中的峰。

 

对于类别变量,众数就是某一种类别。

中位数和平均数都可能不是样本中的值。

中位数不受极值影响,对于类别数据来说,中位数是某一类别(同mode),各变量值与中位数的离差绝对值之和最小,与均数不同。

 

 

 

平均数的求法,令函数等于各变量值与平均数的离差平方之和,该函数表达如下式。

 

对该函数求一阶导,如下式,

 

 

 

当一阶导为零时该函数取到最小值,此时样本均值表达式为:

 

各变量值与平均数的离差平方之和最小,各变量值与中位数的离差绝对值之和最小。两性质验证如下表:

 

平均值可代数计算且无偏有效,所以数学属性比中位数好。

四分位数中上下四分位数有不同算法,算法的准确度也不同,但是n变大则各算法之间差距变小,同时变的更精确。

几何平均数推导:由以下公式转换,其中x值为比率。

1001+G=1001+x1)(1+x2)(1+x3),等式变换之后得到G的表达式,该G值即为

 

 

 

 

应用:一种测量多次的平均数比一次测量更准确,样本均值的方差比随机变量的方差小,更准确。所以用样本均值的分布比总体分布的方差小。样本均值方差是总体分布方差/n.

离散趋势

因为平均值不能代表大多数情况,所以引入描述离散程度的特征值。

异众比率即与众数不一样观测值的比率,如下式。

 

 

 

 

如果异众比率大,则其代表性不是很好。

四分位差:inter quartile range,即3/4处值-1/4处值。

极差:未考虑数据分布

平均差:离均差总和除以总数

 

 

 

方差&标准差

为什么样本方差的分母为n-1

若使用n作为分母,则用样本方差估计总体方差有偏。若使用样本方差则无偏。

 

 

 

2.自由度degree of freedom:指数据个数与附加给独立的观测值的约束或限制的个

数之差,即n-(约束个数)。所以就此例可知,要求样本方差,但其中除已知特征值外,还有一个样本均值的约束,所以样本方差的自由度为n-1

 

除此之外还有变异系数,消除了数据水平高低和计量单位的影响。

 

偏态和峰态

偏态系数即表现数据分布的较正态分布的偏斜程度:

 

 

 

峰态系数即表现与标准正态分布比峰值的高低:

 

 

 

 
o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
第四章 数据的概括性度量

一、集中趋势的度量 众数:一组数据中出现次数最多的变量值,用M0表示。众数主要用于测度分类数据的集中趋势,也可用于顺序数据和数值数据的集中趋势度量。一般情况下,只有在数据量较大的情...

osc_9eqghyd8
2019/05/23
2
0
2 数据的概括性度量

阅读材料为 第四章。 开头先来一个总体内容的概括好了: 集中趋势:众数、中位数、平均数 离散程度:异众比率、四分位差、极差、平均差、方差或标准差、离散系数 分布的形状:偏态系数、峰态...

osc_f6s7vbbf
2019/11/10
2
0
【统计学】第四章

Evernote Export 一组数据的分布特征可以从那几个方面进行测度? 数据的分布特征可以从三个方面进行测度和描述,一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散...

osc_n1z6bj15
2019/02/28
0
0
数据挖掘01-描述性统计

小白入门数据挖掘,从零开始,每周一更 01 数据集中趋势度量 众数 中位数 平均数 算数平均数 几何平均数 加权平均数 分位数 02 数据离散趋势度量

南小明
2019/07/22
0
0
数据的概括性度量

数据的概括性度量 集中趋势的度量 众数 分位数 中位数 四分位数 平均数 离散程度的度量 异众比率 四分位差 方差与标准差 离散系数 偏态与峰态的度量 偏态 峰态

iweans
2018/05/06
22
0

没有更多内容

加载失败,请刷新页面

加载更多

博客园二次元主题——Sakura

碎碎念 嗯,时隔多久也记不清了,我又回来了,总算是忙里偷闲把这篇文章写出来,有人要过很多次我的博客园美化方案,但是实在是忙啊,也因为我的前台技术不好,代码bug很多,所以也有点不想把...

osc_2y6i16fz
43分钟前
19
0
highcharts 自适应div的宽度

如果窗口变化时,highcharts图表是自带自适应的,但是切换折叠菜单时,highchats图表并不自适应外层div的宽度。如何实现适应div的宽度? 在网上找到有个 reflow 的方法,我是在项目中引入的 ...

tianyawhl
43分钟前
23
0
个人作业——软件工程实践总结&个人技术博客

这个作业属于哪个课程 2020春|S班 (福州大学) 这个作业要求在哪里 个人作业——软件工程实践总结&个人技术博客 这个作业的目标 回顾这门课程带来的提升、团队总结、实践中的经验总结、对下届...

osc_g032zryv
44分钟前
17
0
从封装变化的角度看设计模式——对象创建

封装变化之对象创建 在对象创建的过程中,经常会出现的一个问题就是通过显示地指定一个类来创建对象,从而导致紧耦合。这是因为创建对象时指定类名将使你受特定实现的约束而不是特定接口的约...

osc_r5t7sskd
45分钟前
19
0
从封装变化的角度看设计模式——对象创建

封装变化之对象创建 在对象创建的过程中,经常会出现的一个问题就是通过显示地指定一个类来创建对象,从而导致紧耦合。这是因为创建对象时指定类名将使你受特定实现的约束而不是特定接口的约...

osc_i5oyb1xr
46分钟前
11
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部