数据加载之字符集验证

原创
2017/01/10 09:14
阅读数 38
  • 准备两份数据,分别是gbk和utf8编码

不同编码的数据文件

  • 建一张表,同时存放gbk和utf8编码数据,用于对照。
create table customer(cname string,cage int,cmail string) row format delimited fields terminated by ','stored as textfile;

  • 使用客户端连接hadoop,验证数据

先加载utf8的数据,看看是否正常

检查数据

再加载gbk的数据,是否正常

检查数据

所以结论是,如果想要在hadoop上愉快地使用中文,加载之前,先把中文转换成utf-8编码。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部