文档章节

第四章 数据的概括性度量

o
 osc_9eqghyd8
发布于 2019/05/23 15:23
字数 905
阅读 9
收藏 0

「深度学习福利」大神带你进阶工程师,立即查看>>>

一、集中趋势的度量

众数:一组数据中出现次数最多的变量值,用M0表示。众数主要用于测度分类数据的集中趋势,也可用于顺序数据和数值数据的集中趋势度量。一般情况下,只有在数据量较大的情况下众数才有意义。

中位数:一组数据排序后处于中间位置的变量值,用Me表示。如果样本个数为偶数个,中位数为处于中间位置的两个数的平均值。

四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值。设下四分位数为QL,上四分位数为QU,则QL位置=n/4,QU位置=n3/4,如果位置是整数,四分位数就是该位置对应的值,如果是在0.5的位置上,则取该位置两侧的平均值,如果是在0.25和0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊在位置两侧数值的极差。

平均数:分为简单平均数、加权平均数和几何平均数,当变量值是比率形式时,采用几何平均数。

二、离散程度的度量

异众比率:是指非众数组的频数站总频数的比率,用Vr表示。

四分位差:也称为内距或四分间距,它是上四分位数与下四分位数之差,用Qd表示。

极差:一组数据的最大值与最小值之差,用R表示。

平均差:也称为平均绝对离差,它是各变量与其平均数离差绝对值的平均数,用Md表示。

方差:是各变量与其平均值离差平方的平均数,

标准差:方差的平方根称为标准差,标准差是有量纲的,它与变量的计量单位相同,其实际意义要比方差清楚。因此,在对实际分体进行分析时更多地使用标准差。

自由度:样本个数减一即为自由度。

标准分数:变量值与其平均数的离差除以标准差之后的值称为标准分数。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。

经验法则:当一组数据对称分布时(1)约有68%的数据在平均+-1个标准差的范围之内;(2)约有95%的数据在平均+-2个标准差的范围之内;(3)约有99%的数据在平均+-3个标准差的范围之内。而在+-3个标准差之外的数据,统计学上称为离群点。

离散系统:也称为变异系数,它是一组数据的标准差与其平均数之比。(对于平均水平不同或者计量单位不同的不同组别的变量值,不能用标准差直接比较其离散程度,需要用离散系数系数进行比较)

三、偏态与峰态的度量

偏态及其度量:偏态一词由统计学家皮尔逊于1895年首次提出,它是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。

峰态及其度量:峰态一词由统计学家皮尔逊于1905年首次提出,它是对数据分布平峰或尖峰程度的测度。测度峰态的统计量是峰态系数,记作K。

o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
访问安全控制解决方案

本文是《轻量级 Java Web 框架架构设计》的系列博文。 今天想和大家简单的分享一下,在 Smart 中是如何做到访问安全控制的。也就是说,当没有登录或 Session 过期时所做的操作,会自动退回到...

黄勇
2013/11/03
3.7K
8
开源数据访问组件--Smark.Data

Smark.Data是基于Ado.net实现的数据访问组件,提供基于强类型的查询表达式进行灵活的数据查询,统计,修改和删除等操作;采用基于条件驱动的操作模式,使数据操作更简单轻松;内部通过标准SQL...

泥水佬
2013/03/12
2.6K
0
数据中心生命周期管理--Foreman

Foreman是一个集成的数据中心生命周期管理工具,提供了服务开通,配置管理以及报告 功能,和Puppet Dahboard一样,Foreman也是一个Ruby on Rails程序.Foreman和 Dashboard不同的地方是在于,Fore...

匿名
2012/10/24
1.5W
0
Python数据分析工具包--Pandas

Python Data Analysis Library 或 pandas 是连接 SciPy 和 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集...

匿名
2012/10/30
2.1W
2
浏览器中的scheme解释器--SchemeScript

一个用javascript实现的scheme解释器,可以运行在浏览器中或node.js中。 刚刚看到编译原理与实践第二章,一时兴起,想写个以前就想写的scheme的解释器。昨天晚上开始写,到刚才为止,接近一天...

zoowii
2012/11/01
1.2K
0

没有更多内容

加载失败,请刷新页面

加载更多

如何用Postman做接口自动化测试

目录 前言 什么是自动化测试 自动化测试有哪些分类 为什么需要自动化测试 Postman自动化测试演示 1.新建集合 2.新建接口 3.填写自动化测试脚本 4.录入所有接口 5.执行自动化测试 前言 什么是...

osc_71qxolcv
42分钟前
9
0
下载Crypto,CyCrypto,PyCryptodome 报错问题

python下载Crypto,CyCrypto,PyCryptodome,如有site-packages中存在crypto、pycrypto,在pip之前,需要pip3 uninstall crypto、pip3 uninstall pycrypto,否则无法安装成功。这里顺带说一下...

osc_pl4ni83h
43分钟前
16
0
HashMap JDK1.8实现原理

HashMap概述 HashMap存储的是key-value的键值对,允许key为null,也允许value为null。HashMap内部为数组+链表的结构,会根据key的hashCode值来确定数组的索引(确认放在哪个桶里),如果遇到索...

osc_cx8uhydz
45分钟前
11
0
快速打造属于你的接口自动化测试框架

1 接口测试 接口测试是对系统或组件之间的接口进行测试,主要是校验数据的交换,传递和控制管理过程,以及相互逻辑依赖关系。 接口自动化相对于UI自动化来说,属于更底层的测试,这样带来的好...

osc_4eht81t7
46分钟前
6
0
MVC的Action上下文:ActionExecutingContext

就上图来看,大家注意了吗,ActionExecutingContext对象一共有3处引用。下面我来一一解析: 调用base.OnActionExecuting(filterContext)这个后,才会执行后续的ActionFilter,如果你确定只有一...

osc_4otxquc2
47分钟前
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部