加载中
推荐系统-协同过滤

推荐系统概述: 通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。 推荐系统在用户(USER)和物品(ITEM)之间建立一座桥梁, 帮助用户找到...

2019/04/23 15:07
490
用户故事地图

阅读用户故事地图笔记,联合技术,管理,产品的融合经验总结 用户故事不是另一种写需求的方式,讲述用户故事,在过程中用文字和图片相结合的方式辅助讨论,这是一种建立共识的机制.故事即流...

2016/08/14 11:57
849
用户画像数据建模方法

作者:百分点技术总监郭志金 摘自:百分点(ID: baifendian_com)

中级 Linux 用户非常有用的 20 个命令

linux 中级 命令

2016/02/18 19:22
470
spark mllib 协同过滤算法,基于余弦相似度的用户相似度计算

机器学习部分的运行环境 idea15 + spark-assembly-1.6.1-hadoop2.6.0.jar + scala-sdk-2.10.5 + jdk1.8 基于用户对电影的点评,利用spark mllib的协同过滤算法之余弦相似度,计算用户的相似性...

spark mllib 预测之LinearRegression(线性回归)

spark mllib LinearRegression(线性回归), 商品价格与消费者输入之间的关系

算法回顾

第一章:算法简介 二分查找: log10100相当于问“将多少个10相乘 的结果为100,答案是两个:10 × 10 = 100。因此,log10100 = 2。 算法效率: 总结: 二分查找的速度比简单查找快得多。 O(...

分布式系统基本原理

三元组 其实,分布式系统说白了,就是很多机器组成的集群,靠彼此之间的网络通信,担当的角色可能不同,共同完成同一个事情的系统。如果按”实体“来划分的话,就是如下这几种: 节点 -- 系统...

spark mllib 朴素贝叶斯 应用案例

朴素贝叶斯,可应用于垃圾邮件,短信的分类僵尸粉的鉴定等.下面以僵尸粉的鉴定为例

linux 常用命令总结

新手非常有用的20个命令 1. ls命令 ls命令是列出目录内容(List Directory Contents)的意思。运行它就是列出文件夹里的内容,可能是文件也可能是文件夹。 “ls -l”命令已详情模式(long listi...

大数据安全 Ranger

简介 Apache Ranger提供一个集中式安全管理框架, 并解决授权和审计。它可以对Hadoop生态的组件如HDFS、YARN、Hive、HBase等进行细粒度的数据访问控制。通过Ranger统一的管理控制台界面,管理...

破解微信Authorize 授权登录服务服务端课客户端使用

破解微信Authorize 授权登录服务服务端课客户端使用,单点登陆,authorize,AUTH2.0

HTTP认证方式

HTTP认证方式

2015/11/26 14:25
1.2K
HTTP应用

断点续传的实现原理,多线程下载的原理,http代理,虚拟主机

元数据治理 Apache Atlas

Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括 数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能...

http的状态响应码

对常见的http的状态响应码做个备忘

2015/11/26 14:22
103
Elasticsearch-PHP 安装

为 php 安装最有前途的搜索引擎 elasticsearch,elastic

数据分层

1.数据计算层 01.数据计算层-主要考虑方面 计算平台:离线数据计算 实时数据计算 管理:元数据模型整合和应用、 数据表的规范命名 存储元数据: 运行数据: 2.计算的数据分层:数据加工链路 ...

2019/04/11 16:11
110
大数据调度工具oozie详细介绍

背景 之前项目中的sqoop等离线数据迁移job都是利用shell脚本通过crontab进行定时执行,这样实现的话比较简单,但是随着多个job复杂度的提升,无论是协调工作还是任务监控都变得麻烦,我们选择...

http之解决HTTP无状态协议4种方法

HTTP无状态协议,状态保存方法

2015/11/26 14:02
6.3K

没有更多内容

加载失败,请刷新页面

返回顶部
顶部