加载中
用户故事地图

阅读用户故事地图笔记,联合技术,管理,产品的融合经验总结 用户故事不是另一种写需求的方式,讲述用户故事,在过程中用文字和图片相结合的方式辅助讨论,这是一种建立共识的机制.故事即流...

2016/08/14 11:57
612
Spark 小内容

Spark 的一些内容 1.函数作用以及返回值类型 foreach flatMap 返回的迭代器的所有内容构成新的RDD 是一个序列化的数据而不是单个数据项-- a Seq map map:对集合中每个元素进行操作。 flatMa...

2019/04/11 15:26
7
XGBoost原理——机器学习大杀器

XGBoost是什么 Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。因为XGBoost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器。 在决策树中,我们知...

2019/04/23 10:36
29
IntelliJ IDEA 14 scala项目中添加jar包

为初学idea工具,导入 jar包

2016/06/22 10:00
2.2K
LightGBM 算法原理

LightGBM 的动机 GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合...

2019/04/23 14:21
238
HBase 架构和 Java Api

最简单,最易懂,最实用的HBase,快速上手必备收藏

2016/11/24 17:36
888
Spark SQL

Hive On Spark和SparkSQL都是一个翻译层 把一个SQL翻译成分布式可执行的Spark程序。而且大家的引擎都是spark。 两种方式使用SparkSQL,Spark SQL is a Spark module for structured data pro...

2019/04/11 14:56
32
用户画像数据建模方法

作者:百分点技术总监郭志金 摘自:百分点(ID: baifendian_com)

TensorFlow 简介

TensorFlow 简介: 节点 (nodes) 在图中表示数学操作,图中的线 (edges) 则表示在节点间相互联系的多维数组,即张量 (Tensor), 而 (flow) 流 意味着这基于数据流图的计算,TensorFlow为张量从...

机器学习总览与场景使用大全

机器学习分类,算法比较,使用场景

HTTP应用

断点续传的实现原理,多线程下载的原理,http代理,虚拟主机

http协议之初识

详述http概念,特点和工作流程

2015/11/26 13:50
84
元数据治理 Apache Atlas

Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括 数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能...

破解微信Authorize 授权登录服务服务端课客户端使用

破解微信Authorize 授权登录服务服务端课客户端使用,单点登陆,authorize,AUTH2.0

hive 实战总结

hive 体系架构 启动 hive 命令行 进入hive安装目录,输入bin/hive的执行程序,或者输入 hive –service cli hive脚本的执行方式大致有三种 hive可以直接敲hive命令进入interactive模式,直接...

2019/04/10 10:36
267
算法回顾

第一章:算法简介 二分查找: log10100相当于问“将多少个10相乘 的结果为100,答案是两个:10 × 10 = 100。因此,log10100 = 2。 算法效率: 总结: 二分查找的速度比简单查找快得多。 O(...

JVM内存模型和GC

内存模型 这张图是我见过的最能描述JVM内存模型的图,JVM包括两个子系统和两个组件。两个子系统为:class loader(类装载)、Execution engine(执行引擎);两个组件为:Runtime data area...

2019/04/08 20:51
6
JAVA内存泄漏和内存溢出的区别和联系

JAVA内存泄漏和内存溢出的区别和联系 1、内存泄漏memory leak : 是指程序在申请内存后,无法释放已申请的内存空间,一次内存泄漏似乎不会有大的影响,但内存泄漏堆积后的后果就是内存溢出。 ...

2019/04/09 20:56
796
Spark 内存管理

Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。 理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优。本文旨在梳...

2019/03/19 17:48
22
分布式系统基本原理

三元组 其实,分布式系统说白了,就是很多机器组成的集群,靠彼此之间的网络通信,担当的角色可能不同,共同完成同一个事情的系统。如果按”实体“来划分的话,就是如下这几种: 节点 -- 系统...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部