Impala使用手册

原创
2017/01/02 10:50
阅读数 530
  • impala创建的数据放在哪里?

impala没有自己的文件系统,所以impala建的表,都放在hdfs文件系统上。而且根据创建表使用的参数不同,文件的格式也可以不相同。

一般来说,create table不加特殊参数的话,建成的表将是一个txt文件。

根据cloudera的推荐,最适合的格式还是Parquet table. 如果有可能,为了提高性能 ,还是需要把数据从txt转换成列式存储的形式。

运行 DESCRIBE FORMATTED table_name 可以了解数据表的实际格式。

This can be a useful technique to see how Impala represents special values within a text-format data file. Use the DESCRIBE FORMATTED statement to see the HDFS directory where the data files are stored, then use Linux commands such as hdfs dfs -ls hdfs_directory and hdfs dfs -cat hdfs_file to display the contents of an Impala-created text file.

展开阅读全文
打赏
0
2 收藏
分享
加载中
更多评论
打赏
0 评论
2 收藏
0
分享
返回顶部
顶部