加载中
数据分析方法论

数据分析方法论主要有两大块: 1)统计分析方法论: 描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等; 2)营销管理分析...

2018/08/29 14:34
138
统计分析的八种方法

 统计分析的八种方法 一、指标对比分析法 指标对比分析法,又称比较分析法,是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些...

2018/08/29 11:51
98
CRISP-DM 跨行业数据挖掘标准流程

CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘标准流程". 此KDD过程模型于1999年欧盟机构联合起草. 通过近几年的发展,CRISP-DM 模型在各种KDD过程模型中...

2018/08/03 20:08
259
使用sklearn做单机特征工程

使用sklearn做单机特征工程 目录 1 特征工程是什么? 2 数据预处理   2.1 无量纲化     2.1.1 标准化     2.1.2 区间缩放法     2.1.3 标准化与归一化的区别   2.2 对定量特...

2018/08/02 23:16
125
特征工程概述

特征工程 “数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。” 1.概念 维基百科:特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程...

数据挖掘的一般过程

本文主要参考了一篇文章(最后附),那篇文章不太全面,因此加入了自己一点理解。由于实践经验太少,水平有限,希望大神指正。 1. 数据集选取或构造 根据任务的目的,选择数据集。或者从实际...

2018/08/02 22:52
36
R中常用数据挖掘算法包

数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。下面对R语言中常用的数据挖掘包做一个汇总: 连续因变量的预测: stats包 lm函数,实现多元线性回归 st...

2018/08/02 22:39
123
浅谈数据挖掘中的关联规则挖掘

  数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之...

2018/07/29 17:01
40
卡方检验的自由度

自由度:取值不受限制的变量的个数。 如何理解这句简单的话呢?给定一组数据,我们来计算不同的统计量,看看自由度的变化。这些数据分别为 1 2 4 6 8. 5个数。 先来求平均值,这几个数据都可...

2018/07/29 16:37
2.6W
如何用最通俗易懂的方式理解假设检验

假设检验简单来说,就是下面4步的推理逻辑: 为了你更容易理解,我还是从一个生活中的例子开始聊起。 这个例子里举王宝强和马蓉的例子并没有恶意,只是想说明假设检验的背后逻辑,而这个例子...

2018/07/29 16:37
109
统计学——卡方检验和卡方分布

什么是卡方检验 卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比...

2018/07/29 16:35
1.2K
数据挖掘十大经典算法

一、 C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法. C4.5算法继承了ID3算法的长处。并在下面几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用...

2018/07/26 22:28
27

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部