加载中
推荐系统-协同过滤

推荐系统概述: 通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。 推荐系统在用户(USER)和物品(ITEM)之间建立一座桥梁, 帮助用户找到...

2019/04/23 15:07
78
用户画像数据建模方法

作者:百分点技术总监郭志金 摘自:百分点(ID: baifendian_com)

算法回顾

第一章:算法简介 二分查找: log10100相当于问“将多少个10相乘 的结果为100,答案是两个:10 × 10 = 100。因此,log10100 = 2。 算法效率: 总结: 二分查找的速度比简单查找快得多。 O(...

spark mllib 预测之LinearRegression(线性回归)

spark mllib LinearRegression(线性回归), 商品价格与消费者输入之间的关系

spark mllib 朴素贝叶斯 应用案例

朴素贝叶斯,可应用于垃圾邮件,短信的分类僵尸粉的鉴定等.下面以僵尸粉的鉴定为例

分布式系统基本原理

三元组 其实,分布式系统说白了,就是很多机器组成的集群,靠彼此之间的网络通信,担当的角色可能不同,共同完成同一个事情的系统。如果按”实体“来划分的话,就是如下这几种: 节点 -- 系统...

linux 常用命令总结

新手非常有用的20个命令 1. ls命令 ls命令是列出目录内容(List Directory Contents)的意思。运行它就是列出文件夹里的内容,可能是文件也可能是文件夹。 “ls -l”命令已详情模式(long listi...

用户故事地图

阅读用户故事地图笔记,联合技术,管理,产品的融合经验总结 用户故事不是另一种写需求的方式,讲述用户故事,在过程中用文字和图片相结合的方式辅助讨论,这是一种建立共识的机制.故事即流...

2016/08/14 11:57
612
大数据安全 Ranger

简介 Apache Ranger提供一个集中式安全管理框架, 并解决授权和审计。它可以对Hadoop生态的组件如HDFS、YARN、Hive、HBase等进行细粒度的数据访问控制。通过Ranger统一的管理控制台界面,管理...

破解微信Authorize 授权登录服务服务端课客户端使用

破解微信Authorize 授权登录服务服务端课客户端使用,单点登陆,authorize,AUTH2.0

HTTP应用

断点续传的实现原理,多线程下载的原理,http代理,虚拟主机

HTTP认证方式

HTTP认证方式

2015/11/26 14:25
518
http的状态响应码

对常见的http的状态响应码做个备忘

2015/11/26 14:22
62
Elasticsearch-PHP 安装

为 php 安装最有前途的搜索引擎 elasticsearch,elastic

数据分层

1.数据计算层 01.数据计算层-主要考虑方面 计算平台:离线数据计算 实时数据计算 管理:元数据模型整合和应用、 数据表的规范命名 存储元数据: 运行数据: 2.计算的数据分层:数据加工链路 ...

2019/04/11 16:11
13
元数据治理 Apache Atlas

Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括 数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能...

大数据调度工具oozie详细介绍

背景 之前项目中的sqoop等离线数据迁移job都是利用shell脚本通过crontab进行定时执行,这样实现的话比较简单,但是随着多个job复杂度的提升,无论是协调工作还是任务监控都变得麻烦,我们选择...

大数据生命周期管理框架Apache Falcon简介

Apache Falcon是一个开源的hadoop数据生命周期管理框架, 它提供了数据源 (Feed) 的管理服务,如生命周期管理,备份,存档到云等,通过Web UI可以很容易地配置这些预定义的策略, 能够大大简化had...

http之解决HTTP无状态协议4种方法

HTTP无状态协议,状态保存方法

2015/11/26 14:02
3.9K
Intellij-idea工具开发spark常见问题解决备案

Intellij-idea工具开发spark常见问题解决备案,环境部署,打包

没有更多内容

加载失败,请刷新页面

返回顶部
顶部