文档章节

我是数据分析师(三):跟Quick BI纠缠的日子里不得不说的那些事

阿里云云栖社区
 阿里云云栖社区
发布于 2017/07/03 11:25
字数 1581
阅读 10
收藏 1

在帮老公用Quick BI做报表的过程中,一路走来,遇到不少问题,就像两个人的感情在发展过程中,从陌生到熟悉,也会时而抓狂,时而惊喜,总结下那些不得不踩的坑,希望后来者可以绕过。

1、csv文件编码的问题真的很抓狂

一般支持本地文件上传的BI工具,像AWS的QuickSight,阿里云的Quick BI都只支持UTF-8的编码方式,非UTF-8上传后会出现乱码,这时就需要先做编码转化,而很多用csv、excel来做报表的人,是没有技术背景的,做编码转化这件事情本身就非常蛋疼。

这个问题当时也让我非常崩溃,我把excel另存为csv,再上传到Quick BI,发现数据内容显示乱码,nnd,原来excel默认另存csv不是utf-8(我猜可能是GBK),甚至用sublime打开都是乱码,在sublime里转utf-8,发现还是乱码,开发GG说用UltraEdit转吧,可是我下载了UltraEdit在mac上却一点开就闪退了,没法用!什么情况,瞬间感觉头上多了3条线,还有无数只乌鸦从头上飞过....

就这个乱码的问题把我反复来回折腾了好久,才终于把编码格式转换好,因此就给Quick BI提了个建议,问能否支持一些常用的编码方式。

没想到让我惊喜的是,Quick BI目前已经支持了这个功能,一些常见的编码方式都可以自动识别,再也不用到处找人帮忙做编码转换了,而且还支持excel上传了,我连转csv的操作都可以省掉了,这速度,不得不给Quick BI给大大的赞!

2、地图出不来的问题真的很无奈

一般二维表的数据类型要么是int、要么是string,像省份、城市这种都是string类型,一开始我想做地图图表,却发现怎么地图出不来,给了我个趋势图!这是什么鬼👻

后来才知道,原来要先把省份转换为地理纬度,这样才会自动映射上地理位置信息,出现地图。好吧,这个是我的问题,怪不了别人。

切记、切记,如果想用地图做地域分布图,先看看有没有做地理纬度转换,具体操作如下:

3、没有转换成日期格式的字段,没办法作为日期控件进行查询

这也是个坑啊,有些源表存储日期时使用的是string类型,如果没有做日期格式转换,那么就不能解析为日期,只能作为普通string的维度进行枚举查询。

而当你需要用日期控件作为时间查询时,就会发现,怎么不能作为时间查询!!

这时候,需要在数据集编辑页面为该字段选择与源表字段匹配的日期格式,就可以转换为日期维度了。

我们可以看到,转换后,左边字段类型的标识也变成了日期,然后便可在工作表编辑面板和制作仪表板时将该字段作为时间来使用啦啦啦~~~

4、源表字段变更非常烦啊

做报表过程中,最烦的就是当源表字段变化时,有可能之前对数据集的操作会白费。这个问题曾经非常困扰我。

突然有一天发现原来Quick BI提供了同步表结构的功能,可以将源表新增的字段同步至数据集,并且不改变对已有字段的设置。

例如,我上周刚对销售表sale_table(源表中只有data、id两个字段)创建了数据集cube1,并已经做了一些处理。而本周sale_table里又新增了一个销售区域字段(sale_area)。这时候就无需重新对数据集进行操作了,只需在原有的数据集cube1上进行同步表结构,就能将sale_area字段同步过来,且该同步操作不影响已有的其他表字段的设置。如下图所示:

需要注意的是:字段变更会有以下两种情况:

1)新增字段,同步数据结构,对原有数据集不会有任何影响。

2)字段名称变更,比如将A字段变更为AAA,那么在同步数据集之后,你会发现数据集中A和AAA会同时存在,如果A字段被使用或被查询,则会报错。这时候就需要把使用到A字段的地方都替换成AAA,同时在数据集中把A删掉。

5、数据集的分析与编辑傻傻分不清

不知道大家是否注意到数据集的右边有分析、编辑两种操作, 刚看到时我也有点懵...

后来就发现了编辑是对表结构进行操作,如构建关联模型、新建计算度量、同步表结构、新建钻取、维度类型切换、度量设置聚合方式、度量格式化显示等。

 

而数据集的分析则是在工作表中简单地对数据进行过滤筛选,如设置日期条件、分类汇总、排序、求和等过滤条件。

需要注意的是,这两个界面有点类似,如果先进入了分析界面,却发现需要做多表关联或者维度转换,可以从工作表左上角进入数据集编辑界面进行操作。

暂时总结到这里,后续有新的坑再继续整理,希望能给苦逼的分析师们带来一点帮助。如果遇到其他坑,也欢迎来讨论讨论。

文章链接:https://www.zhihu.com/org/a-li-yun-yun-qi-she-qu-48/activities

© 著作权归作者所有

阿里云云栖社区
粉丝 454
博文 1558
码字总数 3823668
作品 0
朝阳
私信 提问
相爱相杀的数据分析师与产品经理

(欢迎转载到个人朋友圈,转载时请带原文链接,公众号和其他媒体转载前请私信联系本人获取授权) 之前答应大家的数据分析师和产品经理的故事,我终于来填坑啦~ 好歹赶在农历新年前完成了,当...

陈丹奕
2017/01/10
0
0
Quick BI助力云上大数据分析---深圳云栖大会

在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家陌停对大数据智能分析产品 Quick BI 进行了深入的剖析。大会现场的精彩分享也赢得观众们的一直认可和热烈的反响。 大数据分析...

云攻略小攻
2018/03/30
0
0
Quick BI v3.0版本全新起航——2018杭州云栖大会

在9月22日杭州云栖大会云上数据中台专场中,阿里巴巴产品专家陌停跟现场的观众们分享了Quick BI v3.0版本的新体验、新分析和新功能。 作为一个高效数据分析与展现的BI套件,Quick BI通过拖拽...

兰柏
2018/09/27
0
0
原来在阿里做BI,也有这么多的痛!

写在前面:BI是重要的职业发展方向,菩提在阿里10年,从事产品和大数据工作,向大家呈现BI人的痛苦、思考、探索。 现分3篇讲述阿里BI们的痛,大家可以更有体感。 第1篇:BI们痛在哪? 第2篇:...

大数据之路
2013/07/12
1K
1
阿里云Quick BI——让人人都成为分析师

在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家潘炎峰(陌停)对大数据智能分析产品 Quick BI 进行了深入的剖析。大会现场的精彩分享也赢得观众们的一直认可和热烈的反响。...

超级吴大龙
2018/03/30
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Git ssh配置

生成密钥对 ssh-keygen -t rsa -C "email@email.com"邮箱替换自己邮箱在地址C:\Users\账户\.ssh下,id_rsa、id_rsa.pub两个文件复制文件id_rsa.pub内容到github\gitlab的Settings-> SSH ......

JUKE
30分钟前
5
0
014、使用docker-compose安装软件

创建docker-compose基础目录 mkdir -p /usr/local/docker 1、安装mysql 在/usr/local/docker/目录下创建mysql目录 mkdir -p /usr/local/docker/mysql 在/usr/local/docker/mysql目录编写doc......

北岩
30分钟前
6
0
【并发那些事 】创建线程的三种方式

创建线程可以说是并发知识中最基础的操作了,JDK 提供的创建线程的方式,如果不包括通过线程池的话,目前有三种形式,它们分别是通过继承 Thread 类,通过实现 Runable 接口,通过 FutureTa...

K1W1
36分钟前
7
0
判断链表是否有环

如果列表中不存在环,最终快指针将会最先到达尾部,此时我们可以返回 false。 如果存在环则会相遇。返回true。 Java代码实现: public boolean hasCycle(ListNode head) { if (head == ...

无名氏的程序员
38分钟前
5
0
uni-app 项目记录

await 等候,等待;期待 什么是async、await await 用于等待异步完成 通常async、await都是跟随Promise一起使用的 async返回的都是一个Promise对象同时async适用于任何类型的函数上。这样awa...

达达前端小酒馆
39分钟前
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部