加载中
算法回顾

第一章:算法简介 二分查找: log10100相当于问“将多少个10相乘 的结果为100,答案是两个:10 × 10 = 100。因此,log10100 = 2。 算法效率: 总结: 二分查找的速度比简单查找快得多。 O(...

spark mllib 随机森林算法

spark mllib 随机森林算法是机器学习、

LightGBM 算法原理

LightGBM 的动机 GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合...

2019/04/23 14:21
1K
spark mllib TF-IDF 文本特征提取算法

TF-IDF 是一种简单的文本特征提取算法

spark mllib FP树 FP-growth 关联关系 挖掘算法

Apriori算法基础上改进的关联关系挖掘算法 FP-growth

spark mllib 协同过滤算法,基于 (交替最小二乘法) ALS 计算

机器学习部分的运行环境 idea15 + spark-assembly-1.6.1-hadoop2.6.0.jar + scala-sdk-2.10.5 + jdk1.8 基于用户对物品的点评,利用spark mllib的协同过滤算法之ALS,为用户推荐商品...

spark mllib 协同过滤算法,基于余弦相似度的用户相似度计算

机器学习部分的运行环境 idea15 + spark-assembly-1.6.1-hadoop2.6.0.jar + scala-sdk-2.10.5 + jdk1.8 基于用户对电影的点评,利用spark mllib的协同过滤算法之余弦相似度,计算用户的相似性...

机器学习总览与场景使用大全

机器学习分类,算法比较,使用场景

推荐系统-协同过滤

推荐系统概述: 通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。 推荐系统在用户(USER)和物品(ITEM)之间建立一座桥梁, 帮助用户找到...

2019/04/23 15:07
320
JVM内存模型和GC

内存模型 这张图是我见过的最能描述JVM内存模型的图,JVM包括两个子系统和两个组件。两个子系统为:class loader(类装载)、Execution engine(执行引擎);两个组件为:Runtime data area...

2019/04/08 20:51
49
spark mllib 决策树 DT

决策树是一种监督学习,分类的一种. 决策树使用案例-出去玩

XGBoost原理——机器学习大杀器

XGBoost是什么 Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。因为XGBoost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器。 在决策树中,我们知...

2019/04/23 10:36
166
HTTPS传输协议原理

HTTPS传输协议原理

数据结构中的各种树简单解释

树的概念 深度(depth):如图所示,根节点为r,v是一个树中间的节点。v的深度,即为v到r的唯一通路经过的边的个数,记作depth(v)。 祖先(ancestor)、后代(descendant):任一节点v在通往树根沿...

2019/04/09 20:13
176
tensorflow 之循环神经网络

应用场景: 应用于语音识别 语音翻译 机器翻译 RNN RNN(Recurrent Neural Networks,循环神经网络)不仅会学习当前时刻的信息,也会依赖之前的序列信息。 由于其特殊的网络模型结构解决了信息...

Spark SQL

Hive On Spark和SparkSQL都是一个翻译层 把一个SQL翻译成分布式可执行的Spark程序。而且大家的引擎都是spark。 两种方式使用SparkSQL,Spark SQL is a Spark module for structured data pro...

2019/04/11 14:56
75
Spark 数据倾斜

什么是数据倾斜 比方WordCount中某个Key对应的数据量非常大的话,就会产生数据倾斜,导致两个后果: OM(单或少数的节点); 拖慢整个Job执行时间(其他已经完成的节点都在等这个还在做的节点...

2019/03/21 09:57
497
分布式系统基本原理

三元组 其实,分布式系统说白了,就是很多机器组成的集群,靠彼此之间的网络通信,担当的角色可能不同,共同完成同一个事情的系统。如果按”实体“来划分的话,就是如下这几种: 节点 -- 系统...

JAVA内存泄漏和内存溢出的区别和联系

JAVA内存泄漏和内存溢出的区别和联系 1、内存泄漏memory leak : 是指程序在申请内存后,无法释放已申请的内存空间,一次内存泄漏似乎不会有大的影响,但内存泄漏堆积后的后果就是内存溢出。 ...

2019/04/09 20:56
3.8K
用户画像数据建模方法

作者:百分点技术总监郭志金 摘自:百分点(ID: baifendian_com)

没有更多内容

加载失败,请刷新页面

返回顶部
顶部