文档章节

spark资料

vieky
 vieky
发布于 2014/11/21 10:06
字数 271
阅读 203
收藏 0

(一)spark 相关安装部署、开发环境 1、大数据利器:Spark的单机部署与测试笔记

http://bbs.chinahadoop.cn/article-4057-1.html

2、Spark 0.9.1 Standalone模式分布式部署

http://chinasparker.sinaapp.com/?p=67

https://spark.apache.org/docs/latest/spark-standalone.html#installing-spark-standalone-to-a-cluster

3、Spark实战:单节点本地模式搭建Spark运行环境

http://www.cstor.cn/textdetail_7500.html

4、Spark 1.0.0 横空出世 Spark on Yarn 部署(Hadoop 2.4)

http://blog.csdn.net/tntzbzc/article/details/27817189

5、Apache Spark探秘:三种分布式部署方式比较

http://dongxicheng.org/framework-on-yarn/apache-spark-comparing-three-deploying-ways/

(二)spark 原理与编码 1、理解Spark的核心RDD

http://www.infoq.com/cn/articles/spark-core-rdd

2、How-to: Translate from MapReduce to Apache Spark(怎样从 MapReduce 迁移到 Spark)

http://blog.cloudera.com/blog/2014/09/how-to-translate-from-mapreduce-to-apache-spark/

3、Spark SQL 源码分析之 In-Memory Columnar Storage 之 cache table

http://blog.csdn.net/oopsoom/article/details/39525483

(三)spark 监控与管理 1、Common Spark Troubleshooting

http://www.datastax.com/dev/blog/common-spark-troubleshooting

2、

(四)YARN & spark 1、Apache Spark探秘:多进程模型还是多线程模型?

http://dongxicheng.org/framework-on-yarn/apache-spark-multi-threads-model/

(五)spark 数据平台架构

(六)spark 应用与实践 1、How-to: Do Near-Real Time Sessionization with Spark Streaming and Apache Hadoop

http://blog.cloudera.com/blog/2014/11/how-to-do-near-real-time-sessionization-with-spark-streaming-and-apache-hadoop/

2、

本文转载自:http://my.oschina.net/leejun2005/blog/311486#OSC_h1_1

共有 人打赏支持
vieky
粉丝 12
博文 55
码字总数 47106
作品 0
长沙
高级程序员
加载中

评论(1)

0000001
0000001
大数据时代,加油
2018年互联网大数据之大数据潮流的主先锋Spark

首先,跟大家简单说一下什么是大数据,没有百度的复杂,就是我自己总结的,有什么不对的地方,请大家指教! 1、何为大数据? 大数据就是短时间内,快速产生大量的多种多样的有价值的数据。 ...

A尚学堂Len老师
08/22
0
0
hadoop和spark的区别你搞明白了吗

学习hadoop已经有很长一段时间了,好像是二三月份的时候朋友给了一个国产Hadoop发行版下载地址,因为还是在学习阶段就下载了一个三节点的学习版玩一下。在研究、学习hadoop的朋友可以去找一下...

左手的倒影
06/27
0
0
hadoop和spark的区别介绍

学习hadoop已经有很长一段时间了,好像是二三月份的时候朋友给了一个国产Hadoop发行版下载地址,因为还是在学习阶段就下载了一个三节点的学习版玩一下。在研究、学习hadoop的朋友可以去找一下...

adnb34g
06/22
0
0
你不能错过的 spark 学习资源

1. 书籍,在线文档 2. 网站 3. Databricks Blog 4. 文章,博客 5. 视频

u012608836
04/12
0
0
Kylin 2.0 Spark Cubing 优化改进

Kylin 2.0 引入了Spark Cubing beta版本,本文主要介绍我是如何让 Spark Cubing 支持 启用Kerberos的HBase集群,再介绍下Spark Cubing的性能测试结果和适用场景。 Spark Cubing 简介 在简介S...

大数据之路
2012/08/28
0
0

没有更多内容

加载失败,请刷新页面

加载更多

多线程

1. 多线程概念。并发和并行的概念。 多线程指的是一段时间内cpu同时执行多个线程。一个程序至少运行>=1个进程,进程就是运行中的程序,而一个进程至少运行>=1个线程,线程是操作系统能调度的...

鱼想吃肉
8分钟前
0
0
HBase 表修复在线方式和离线方式

一、在线修复 1.1 使用检查命令 $ ./bin/hbase hbck 该命令可完整修复 HBase 元数据信息;存在有错误信息会进行输出; 也可以通过如下命令查看详细信息: $ ./bin/hbase hbck -details 1.2 ...

Ryan-瑞恩
33分钟前
1
0
redis 系列二 -- 常用命令

1.基础命令 info ping quit save dbsize select flushdb flushall 2.键命令 2.1 set 直接赋值 set a a 2.2 get 取值 get a 2.3 exists 是否存在 exists a 2.4 expire 设置剩余时间 秒 expire......

imbiao
今天
1
0
php foreach

<?php// 数组的引用$a=array(1,2,3,4,5);foreach($a as $key=>&$value){$value=$value*2;}print_r($a);echo " $key -------------------$value\r\n";/** * ...

小张525
今天
1
0
12-利用思维导图梳理JavaSE-多线程

12-利用思维导图梳理JavaSE-多线程 主要内容 1.线程概念 2.线程开发 3.线程的状态 4.线程的同步和死锁 5.Java5.0并发库类 QQ/知识星球/个人WeChat/公众号二维码 本文为原创文章,如果对你有一...

飞鱼说编程
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部