文档章节

数据归一化和两种常用的归一化方法

弘_轩
 弘_轩
发布于 2017/03/02 21:47
字数 345
阅读 9
收藏 0

 

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:

一、min-max标准化(Min-Max Normalization)

也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间。转换函数如下:

clip_image002

其中max为样本数据的最大值,min为样本数据的最小值。这种方法有个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

二、Z-score标准化方法

这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:

clip_image004

其中clip_image006为所有样本数据的均值,clip_image008为所有样本数据的标准差

本文转载自:

上一篇: SVD详解
下一篇: spark 性能调优
弘_轩
粉丝 5
博文 16
码字总数 10368
作品 0
福州
高级程序员
私信 提问
机器学习中的归一化方法(Deep learning Normalization Method)

机器学习、数据挖掘工作中,数据前期准备、数据预处理过程、特征提取等几个步骤几乎要花费数据工程师一半的工作时间。同时,数据预处理的效果也直接影响了后续模型能否有效的工作。然而,目前...

weixin_38208741
2018/04/18
0
0
机器学习之 数据预处理 preprocessing

数据归一化及两种常用归一化方法 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量...

qq_37634812
2017/11/27
0
0
谷歌大脑发布GAN全景图:看百家争鸣的生成对抗网络

  选自arXiv   机器之心编译   参与:思源、刘晓坤      近日,谷歌大脑发布了一篇全面梳理 GAN 的论文,该研究从损失函数、对抗架构、正则化、归一化和度量方法等几大方向整理生成...

机器之心
2018/07/15
0
0
《百面机器学习》笔记-特征工程相关面试题

1. 什么是特征工程 对数据进行一系列处理构成特征输入给模型 例如,我们想让机器识别这个图片是不是苹果,可以选择 形状,颜色分布,边 来作为feature: 特征越好,模型的性能越好,而且可以...

不会停的蜗牛
05/13
0
0
opencv归一化函数normalize详解

opencv 2 归一化函数normalize详解 1. 归一化定义与作用 归一化就是要把需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保...

Joe科技
2017/01/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

微课程 | 第六课《复杂查询》

https://v.youku.com/v_show/id_XNDQ2MDAzOTE2MA==.html 上一期我们通过基本拆分算法,展示基本配置是什么样的。现在来介绍下 dble 其他的一些功能。 dble 查询流程图 首先基本的 DML 我们已...

爱可生
17分钟前
3
0
在pad上点击输入框调出小键盘

在页面加载时加入: var asForm = System.Windows.Automation.AutomationElement.FromHandle(this.Handle); private void frmPadWIPCallMaterial_Load(object sender, Ev......

_Somuns
18分钟前
2
0
服务身份授权OpenIAM

使用OpenIAM作为服务间统一身份和资源授权的解决方案。它基于AWS的IAM模型设计,为服务接口提供统一管理了身份认证和资源授权管控能力。服务提供方可通过OpenIAM来实现接口访问的细粒度管控。...

ZH-JSON
24分钟前
2
0
远程调用----HttpClient连接池

学连接池首先要明白: 1.http连接池也不是万能的,过多的长连接会占用服务器资源,导致其他服务受阻 2.http连接池值适用于请求是经常访问同一主机(或同一接口)的情况下 3.并发数不高的情况下资源...

苗小喵
32分钟前
4
0
mybatis_plus一对一实体映射

场景:查询中间表对应的用户和角色,这里一条中间表数据分别只对应一个用户和一个角色。当然一般不会有这样的需求,这里只是举例一对一关系. 一、数据结构 1、用户表 2、角色表 3、中间表 二...

一个yuanbeth
38分钟前
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部