文档章节

Apache Kudu 1.4.0 中文文档

片刻
 片刻
发布于 2017/07/13 11:11
字数 738
阅读 68
收藏 0

原文地址 : http://www.apachecn.org/bigdata/kudu/156.html

ApacheCN cwiki 地址为 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813594

ApacheCN - 关于我们 : http://www.apache.wiki/pages/viewpage.action?pageId=2887249

已完成 80%,欢迎加入我们一起来完成翻译!~ 

还差一点点就完工了,希望有想法的朋友,一起来维护迭代更新,另找找一位 kudu 的 admin,专门跟进这个事情,有兴趣的联系我!

Apache Kudu 1.4.0 中文文档

Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 hadoop 生态系统应用的常见技术特性: 它在 commodity hardware(商品硬件)上运行,horizontally scalable(水平可扩展),并支持 highly available(高可用)性操作。

Kudu 有许多不错的设计,它的一些优点包括 :

  • OLAP 工作的快速处理。
  • 与 MapReduce,Spark 和其他 Hadoop 生态系统组件集成。
  • 与 Apache Impala(incubating)紧密集成,使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案。
  • 强大而灵活的一致性模型,允许您根据每个 per-request(请求选择)一致性要求,包括 strict-serializable(严格可序列化)一致性的选项。
  • 针对同时运行顺序和随机工作负载的情况性能很好。
  • 易于管理以及可以使用 Cloudera Manager 来进行管理。
  • High availability(高可用性)。Tablet Servers 和 Masters 使用了 Raft Consensus Algorithm,确保只要有一半以上的副本可用,该 tablet 便可用于读写。例如,如果 3 个副本中有 2 个或 5 个副本中的 3 个可用,则该 tablet 可用。即使在 leader tablet 出现故障的情况下,读取功能也可以通过 read-only(只读的)follower tablets 来进行服务。
  • 结构化数据模型。

通过结合这些所有的特性,Kudu 目标是支持在当代 Hadoop 存储技术上难以实现的应用的家族。Kudu 是一个很好的解决方案的几个例子是 :

  • 报告那些需要立即向终端用户提供  newly-arrived(新来的)数据的应用程序。
  • 必须同时支持的 Time-series(时间序列)应用程序 :
    • 查询大量历史数据。
    • 必须非常快地返回关于单个实体的细粒度查询。
  • 使用预测模型进行实时决策的应用程序,可根据所有历史数据定期刷新预测模型。
  • 有关这些和其他方案的更多信息,请参阅 Example Use Cases

。。。。。。

更多细节介绍请看 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813605

欢迎转载:ApacheCN » Apache Kudu 1.4.0 中文文档 | ApacheCN

© 著作权归作者所有

共有 人打赏支持
片刻
粉丝 98
博文 268
码字总数 306559
作品 0
海淀
高级程序员
私信 提问
0021-使用JDBC向Kudu表插入中文字符-cast的秘密

1.问题描述 使用Impala JDBC向Kudu表中插入中文字符,插入的中文字符串乱码,中文字符串被截断。 继之前文档使用sql拼接方式插入中文字符串乱码解决方法后,此文档描述使用jdbc的PreparedSta...

Hadoop实操
11/19
0
0
Scikit-Learn (Sklearn) 中文文档 0.19

Scikit-Learn (Sklearn) 中文文档 0.19 scikit-learn 是基于 Python 语言的机器学习工具。 简单高效的数据挖掘和数据分析工具 可供大家在各种环境中重复使用 建立在 NumPy ,SciPy 和 matplo...

wizardforcel
2017/12/10
0
0
Scikit-Learn (Sklearn) 中文文档 0.19

Scikit-Learn (Sklearn) 中文文档 0.19 scikit-learn 是基于 Python 语言的机器学习工具。 简单高效的数据挖掘和数据分析工具 可供大家在各种环境中重复使用 建立在 NumPy ,SciPy 和 matplo...

ApacheCN飞龙
2017/12/10
303
0
0020-使用JDBC向Kudu表插入中文字符-双引号的秘密

1.问题描述 使用Impala JDBC向Kudu表中插入中文字符,插入的中文字符串乱码,中文字符串被截断。 2.问题复现 测试环境: CDH5.12.0 Kudu1.4.0 ImpalaJDBC41_2.5.35 1.使用ImpalaJDBC代码进行...

Hadoop实操
11/19
0
0
friso-1.4.0 发布 - 英文同义词追加+中英任意组合识别+小数单位识别

friso中文分词器friso是使用c语言开发的一个开源中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中,例如:MySQL,PHP, 并且提供了一个php扩展:...

狮子的魂
2013/10/16
883
6

没有更多内容

加载失败,请刷新页面

加载更多

十万个为什么之为什么大家都说dubbo

Dubbo是什么? 使用背景 dubbo为什么这么流行, 为什么大家都这么喜欢用dubbo; 通过了解分布式开发了解到, 为适应访问量暴增,业务拆分后, 子应用部署在多台服务器上,而多台服务器通过可以通过d...

尾生
36分钟前
2
0
Docker搭建代码质量检测平台-SonarQube(中文版)

Sonar是一个用于代码质量管理的开源平台,用于管理源代码的质量,可以从七个维度检测代码质量。通过插件形式,可以支持包括java,C#,C/C++,PL/SQL,Cobol,JavaScrip,Groovy等等二十几种编程语言...

Jacktanger
43分钟前
2
0
Windows / Linux / MacOS 设置代理上网的方法汇总

本文汇总了 Windows / Linux / MacOS 设置代理上网的各种方法,总结如下: 1、设置系统代理(Windows、Linux、MacOS) 2、设置代理插件(Chrome、Chromium、Firefox、Opera、QQ等浏览器) 3、...

sunboy2050
昨天
4
0
自定义 Maven 的 repositories

有时,应用中需要一些比较新的依赖,而这些依赖并没有正式发布,还是处于milestone或者是snapshot阶段,并不能从中央仓库或者镜像站上下载到。此时,就需要 自定义Maven的<repositories>。 ...

waylau
昨天
3
0
徒手写一个es6代码库

mkdir democd demonpm initnpm install -g babelnpm install -g babel-clinpm install --save-dev babel-preset-es2015-node5 在项目目录创建两个文件夹 functional-playground ......

lilugirl
昨天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部