加载中
大数据教程(16.1)Hbase简介

本篇博客博主将简单介绍Hbase的相关知识。 1.1 什么是hbase HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。...

大数据教程(14.2)网站数据分析(二)

上一篇文章介绍了'网站点击流数据分析项目业务背景';本篇博客博主将继续分享网站分析的相关知识。 一、整体技术流程及架构 1.1.数据处理流程 该项目是一个纯粹的数据分析项目,其整体流程基...

大数据教程(14.1)网站数据分析(一)

前面一章,介绍了大数据hadoop生态圈中组件Flume、azkaban、sqoop的相关知识,截止目前,大数据离线分析的技术知识基本已经介绍完(当然,各组件还有一些其它的替代方案,需要小伙伴们下来自...

2019/03/31 14:40
367
大数据教程(13.4)azkaban实例演示

上一章节,介绍了azkaban的简介、安装相关的知识;本篇博客博主将为小伙伴们分享azkaban的一些案例来帮助熟悉其使用。 Azkaba内置的任务类型支持command、java; 一、command类型单一job示例...

2019/03/16 23:17
1.5K
大数据教程(13.3)azkaban简介&安装

上一节介绍了Flume多个agent连接配合使用。本节博主将为小伙伴们介绍azkaban的相关概念、简单的安装使用。由于azkaban使用新版本太耗时间,需要编译安装,所以博主此次就使用编译好的老版本2...

2019/03/08 00:39
746
大数据教程(13.2)Flume多个agent连接

上一节介绍了Flume如何将数据收集到hdfs文件系统上。本节将分享多个agent连接配合使用。 原理图: 操作步骤: 1、将centos-aaron-h1的flume复制一份到centos-aaron-h2 sudo scp -r /home/had...

2019/02/26 00:35
500
大数据教程(13.1)Flume使用

上一节介绍了Flume的一个入门案例,本节博主将分享Flume如何将数据收集到hdfs文件系统上。 操作步骤: 1、进入Flume配置目录 cd ~/apps/apache-flume-1.6.0-bin/conf 2、新建配置文件 vi tai...

2019/02/13 23:35
379
大数据教程(12.2)广告推荐

在我们浏览的App、网站的时候,经常会看到一些广告,而且感觉这些广告还和我们最近的购物记录或者商品查看记录有关。这些就是广告精准智能推荐系统完成的功能。 以下是广告推荐应用的场景: ...

2019/01/30 23:49
263
大数据教程(12.1)hive中SQL操作补充知识

上一篇博客分享了hive的基础操作知识,本节博主将继续补充分享一些hive的SQL操作知识。 一、保存select查询结果的几种方式: 1、将查询结果保存到一张新的hive表中 create table t_tmp as se...

2019/01/26 21:39
288
大数据教程(11.5)仓库工具hive的实现机制

上一篇文章介绍了hadoop联邦集群的搭建过程。至此,hadoop的整个知识系统就差不多结束了。本篇博客开始,博主将分享数据仓库hive工具的原理以及使用。 一、Hive基本概念 (1)什么是Hive Hive...

2019/01/15 23:29
354

没有更多内容

加载失败,请刷新页面

返回顶部
顶部