文档章节

我是数据分析师(三):跟Quick BI纠缠的日子里不得不说的那些事

于溪落霞
 于溪落霞
发布于 2017/07/03 11:59
字数 1507
阅读 5
收藏 0

1、csv文件编码的问题真的很抓狂

一般支持本地文件上传的BI工具,像AWS的QuickSight,阿里云的Quick BI都只支持UTF-8的编码方式,非UTF-8上传后会出现乱码,这时就需要先做编码转化,而很多用csv、excel来做报表的人,是没有技术背景的,做编码转化这件事情本身就非常蛋疼。

这个问题当时也让我非常崩溃,我把excel另存为csv,再上传到Quick BI,发现数据内容显示乱码,nnd,原来excel默认另存csv不是utf-8(我猜可能是GBK),甚至用sublime打开都是乱码,在sublime里转utf-8,发现还是乱码,开发GG说用UltraEdit转吧,可是我下载了UltraEdit在mac上却一点开就闪退了,没法用!什么情况,瞬间感觉头上多了3条线,还有无数只乌鸦从头上飞过...

就这个乱码的问题把我反复来回折腾了好久,才终于把编码格式转换好,因此就给Quick BI提了个建议,问能否支持一些常用的编码方式。

没想到让我惊喜的是,Quick BI目前已经支持了这个功能,一些常见的编码方式都可以自动识别,再也不用到处找人帮忙做编码转换了,而且还支持excel上传了,我连转csv的操作都可以省掉了,这速度,不得不给Quick BI给大大的赞!

2、地图出不来的问题真的很无奈

一般二维表的数据类型要么是int、要么是string,像省份、城市这种都是string类型,一开始我想做地图图表,却发现怎么地图出不来,给了我个趋势图!这是什么鬼👻

后来才知道,原来要先把省份转换为地理纬度,这样才会自动映射上地理位置信息,出现地图。好吧,这个是我的问题,怪不了别人。

切记、切记,如果想用地图做地域分布图,先看看有没有做地理纬度转换,具体操作如下:

3、没有转换成日期格式的字段,没办法作为日期控件进行查询

这也是个坑啊,有些源表存储日期时使用的是string类型,如果没有做日期格式转换,那么就不能解析为日期,只能作为普通string的维度进行枚举查询。

而当你需要用日期控件作为时间查询时,就会发现,怎么不能作为时间查询!!

这时候,需要在数据集编辑页面为该字段选择与源表字段匹配的日期格式,就可以转换为日期维度了。

我们可以看到,转换后,左边字段类型的标识也变成了日期,然后便可在工作表编辑面板和制作仪表板时将该字段作为时间来使用啦啦啦~~~

4、源表字段变更非常烦啊

做报表过程中,最烦的就是当源表字段变化时,有可能之前对数据集的操作会白费。这个问题曾经非常困扰我。

突然有一天发现原来Quick BI提供了同步表结构的功能,可以将源表新增的字段同步至数据集,并且不改变对已有字段的设置。

例如,我上周刚对销售表sale_table(源表中只有data、id两个字段)创建了数据集cube1,并已经做了一些处理。而本周sale_table里又新增了一个销售区域字段(sale_area)。这时候就无需重新对数据集进行操作了,只需在原有的数据集cube1上进行同步表结构,就能将sale_area字段同步过来,且该同步操作不影响已有的其他表字段的设置。如下图所示:

需要注意的是:字段变更会有以下两种情况:

(1)新增字段,同步数据结构,对原有数据集不会有任何影响。

(2)字段名称变更,比如将A字段变更为AAA,那么在同步数据集之后,你会发现数据集中A和AAA会同时存在,如果A字段被使用或被查询,则会报错。这时候就需要把使用到A字段的地方都替换成AAA,同时在数据集中把A删掉。

5、数据集的分析与编辑傻傻分不清

不知道大家是否注意到数据集的右边有分析、编辑两种操作, 刚看到时我也有点懵...

后来就发现了编辑是对表结构进行操作,如构建关联模型、新建计算度量、同步表结构、新建钻取、维度类型切换、度量设置聚合方式、度量格式化显示等。

而数据集的分析则是在工作表中简单地对数据进行过滤筛选,如设置日期条件、分类汇总、排序、求和等过滤条件。

需要注意的是,这两个界面有点类似,如果先进入了分析界面,却发现需要做多表关联或者维度转换,可以从工作表左上角进入数据集编辑界面进行操作。

暂时总结到这里,后续有新的坑再继续整理,希望能给苦逼的分析师们带来一点帮助。如果遇到其他坑,也欢迎来讨论讨论。

文章链接:https://www.zhihu.com/org/a-li-yun-yun-qi-she-qu-48/activities

本文转载自:https://www.zhihu.com/org/a-li-yun-yun-qi-she-qu-48/activities

共有 人打赏支持
于溪落霞
粉丝 3
博文 27
码字总数 22851
作品 0
私信 提问
相爱相杀的数据分析师与产品经理

(欢迎转载到个人朋友圈,转载时请带原文链接,公众号和其他媒体转载前请私信联系本人获取授权) 之前答应大家的数据分析师和产品经理的故事,我终于来填坑啦~ 好歹赶在农历新年前完成了,当...

陈丹奕
2017/01/10
0
0
Quick BI助力云上大数据分析---深圳云栖大会

在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家陌停对大数据智能分析产品 Quick BI 进行了深入的剖析。大会现场的精彩分享也赢得观众们的一直认可和热烈的反响。 大数据分析...

云攻略小攻
2018/03/30
0
0
Quick BI v3.0版本全新起航——2018杭州云栖大会

在9月22日杭州云栖大会云上数据中台专场中,阿里巴巴产品专家陌停跟现场的观众们分享了Quick BI v3.0版本的新体验、新分析和新功能。 作为一个高效数据分析与展现的BI套件,Quick BI通过拖拽...

兰柏
2018/09/27
0
0
阿里云Quick BI——让人人都成为分析师

在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家潘炎峰(陌停)对大数据智能分析产品 Quick BI 进行了深入的剖析。大会现场的精彩分享也赢得观众们的一直认可和热烈的反响。...

超级吴大龙
2018/03/30
0
0
数据分析专家带你实战Quick BI

在2018云栖大会上,数据产品专家潘炎讲述了关于大数据可视化面临的挑战,并对Quick BI的核心能力进行了详细的刨析,最后对Qucik BI的未来发展做出了一定的规划。 数十款阿里云产品限时折扣中...

wanwlxmmd
2018/05/07
0
0

没有更多内容

加载失败,请刷新页面

加载更多

二进制相关

二进制 众所周知计算机使用的是二进制,数字的二进制是如何表示的呢? 实际就是逢二进一。比如 2 用二进制就是 10。那么根据此可以推算出 5的二进制等于 10*10+1 即为 101。 在计算机中,负数以...

NotFound403
昨天
2
0
day22:

1、写一个getinterface.sh 脚本可以接受选项[i,I],完成下面任务: 1)使用格式:getinterface.sh [-i interface | -I ip] 2)当用户使用-i选项时,显示指定网卡的IP地址;当用户使用-I选项...

芬野de博客
昨天
2
0
Spring Cloud Alibaba基础教程:使用Nacos实现服务注册与发现

自Spring Cloud Alibaba发布第一个Release以来,就备受国内开发者的高度关注。虽然Spring Cloud Alibaba还没能纳入Spring Cloud的主版本管理中,但是凭借阿里中间件团队的背景,还是得到不少...

程序猿DD
昨天
4
0
Java并发编程:深入剖析ThreadLocal

ThreadLocal 的理解 ThreadLocal,很多地方叫线程本地变量,或线程本地存储。ThreadLocal为变量在每个线程中都创建了一个副本,每个线程可以访问自己内部的副本变量。===》解决的问题是线程间...

细节探索者
昨天
3
0
【Python3之异常处理】

一、错误和异常 1.错误 代码运行前的语法或者逻辑错误 语法错误(这种错误,根本过不了python解释器的语法检测,必须在程序执行前就改正) def test: ^SyntaxError: invalid...

dragon_tech
昨天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部