连击 天
fork: star:
##问题背景 在终端运行 spark-sql 命令,创建一张表,然后使用 LOAD DATA LOCAL INPATH 语法将本地文件中的数据加载到表中,虽然数据能够成功加载进去,但还是提示以下错误: ##问题分析 本地...
##问题背景 Azkaban 是由 Linkedin 公司推出的一个批量工作流任务调度器,用于在一个工作流内以一个特定的顺序运行一组工作和流程。我们公司大数据集群的作业调度使用的就是 Azkaban。有同事...
##问题描述 使用 Hive JDBC 连接 Hive Metastore 报以下错误: ##原因分析 Hive JDBC 版本和 Hive 版本不一致导致的,集群中使用的 Hive 版本是 0.12.0-cdh5.0.2, 但是 Hive JDBC 的版本却是...
Spring for Apache Hadoop简化了开发使用了HDFS, MapReduce, Pig 以及 Hive 等 Apache Hadoop 生态技术的应用程序的过程,它提供了一个统一的配置模型和易于使用的API。本文使用一个简单的示...
##问题背景 一般我们创建 Hive 表时都需要给表和字段加上注释以便理解表的用途与字段的含义。但是往往在创建 Hive 表后查看表结构发现中文注释乱码,比较头疼。本文总结了一下针对这种情况的...
##前期工作 安装JDK 安装Hadoop 安装MySQL ##安装Hive ###下载Hive安装包 可以从 Apache 其中一个镜像站点中下载最新稳定版的 Hive, apache-hive-2.1.1-bin.tar.gz。 解压安装Hive 使用以下命...
##df命令 使用 df -h 命令可以查看磁盘各分区大小、已使用空间以及挂载点等信息. ##du命令 使用 du 命令可以查看某个目录所占用的磁盘空间大小。常见的用法是: du -sh folder....
##ssh-keygen命令创建公钥私钥对 在终端输入以下命令: ssh-keygen -t rsa 一路回车, 这样就会创建一个公钥私钥对 ##ssh-copy-id命令将公钥传到远程服务器 在终端输入以下命令: ssh-copy-id...
##背景 在日常的项目开发过程中, 会有很多的配置文件, 而项目对应有多套环境(开发、测试、预发布、生产), 不同的环境使用的配置属性又不一样, 比如数据库连接属性、服务器日志文件路径、缓存...
HBase – Hadoop Database, 是一个高可靠性的、高性能的、可伸缩的、面向列存储的开源分布式存储系统。在前文《HBase单机模式和伪分布式模式安装和配置》的基础上, 本文主要介绍 HBase 全分布...
HBase – Hadoop Database, 是一个高可靠性的、高性能的、可伸缩的、面向列存储的开源分布式存储系统。本文介绍了 HBase 单机模式和伪分布式模式的安装和配置
ZooKeeper命令行脚本 ZooKeeper安装目录下的 bin 目录下提供了一些命令行工具。 脚本 说明 zkCleanup.sh 用于清理 ZooKeeper 事务日志文件和对应的数据快照文件 zkCli.sh ZooKeeper 客户端 ...
##前言 在ZooKeeper安装和配置一文中, 我们使用了 stat 命令来验证 ZooKeeper 服务器是否成功启动。ZooKeeper 还支持很多类似的由四个字母组成的命令, 我们称之为 "四字命令"。可以通过 teln...
本文详细展示了ZooKeeper单机和集群模式下的安装和配置
VMware Fusion中虚拟机的IP总是不断变化,导致自己搭建的Hadoop、Spark集群的维护非常不方便, 下面就展示如何去为虚拟机指定IP地址
Scala的优势之一就是它可以很容易与Java代码混合使用
每种编程语言都会以一个 "Hello, world!" 程序作为开始, 本文就使用 Scala 语言编写 "Hello, world!" 程序来开始 Scala 的学习之旅!
没有更多内容
加载失败,请刷新页面
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复