文档章节

我是数据分析师(三):跟Quick BI纠缠的日子里不得不说的那些事

于溪落霞
 于溪落霞
发布于 2017/07/03 11:59
字数 1507
阅读 5
收藏 0
点赞 0
评论 0

1、csv文件编码的问题真的很抓狂

一般支持本地文件上传的BI工具,像AWS的QuickSight,阿里云的Quick BI都只支持UTF-8的编码方式,非UTF-8上传后会出现乱码,这时就需要先做编码转化,而很多用csv、excel来做报表的人,是没有技术背景的,做编码转化这件事情本身就非常蛋疼。

这个问题当时也让我非常崩溃,我把excel另存为csv,再上传到Quick BI,发现数据内容显示乱码,nnd,原来excel默认另存csv不是utf-8(我猜可能是GBK),甚至用sublime打开都是乱码,在sublime里转utf-8,发现还是乱码,开发GG说用UltraEdit转吧,可是我下载了UltraEdit在mac上却一点开就闪退了,没法用!什么情况,瞬间感觉头上多了3条线,还有无数只乌鸦从头上飞过...

就这个乱码的问题把我反复来回折腾了好久,才终于把编码格式转换好,因此就给Quick BI提了个建议,问能否支持一些常用的编码方式。

没想到让我惊喜的是,Quick BI目前已经支持了这个功能,一些常见的编码方式都可以自动识别,再也不用到处找人帮忙做编码转换了,而且还支持excel上传了,我连转csv的操作都可以省掉了,这速度,不得不给Quick BI给大大的赞!

2、地图出不来的问题真的很无奈

一般二维表的数据类型要么是int、要么是string,像省份、城市这种都是string类型,一开始我想做地图图表,却发现怎么地图出不来,给了我个趋势图!这是什么鬼👻

后来才知道,原来要先把省份转换为地理纬度,这样才会自动映射上地理位置信息,出现地图。好吧,这个是我的问题,怪不了别人。

切记、切记,如果想用地图做地域分布图,先看看有没有做地理纬度转换,具体操作如下:

3、没有转换成日期格式的字段,没办法作为日期控件进行查询

这也是个坑啊,有些源表存储日期时使用的是string类型,如果没有做日期格式转换,那么就不能解析为日期,只能作为普通string的维度进行枚举查询。

而当你需要用日期控件作为时间查询时,就会发现,怎么不能作为时间查询!!

这时候,需要在数据集编辑页面为该字段选择与源表字段匹配的日期格式,就可以转换为日期维度了。

我们可以看到,转换后,左边字段类型的标识也变成了日期,然后便可在工作表编辑面板和制作仪表板时将该字段作为时间来使用啦啦啦~~~

4、源表字段变更非常烦啊

做报表过程中,最烦的就是当源表字段变化时,有可能之前对数据集的操作会白费。这个问题曾经非常困扰我。

突然有一天发现原来Quick BI提供了同步表结构的功能,可以将源表新增的字段同步至数据集,并且不改变对已有字段的设置。

例如,我上周刚对销售表sale_table(源表中只有data、id两个字段)创建了数据集cube1,并已经做了一些处理。而本周sale_table里又新增了一个销售区域字段(sale_area)。这时候就无需重新对数据集进行操作了,只需在原有的数据集cube1上进行同步表结构,就能将sale_area字段同步过来,且该同步操作不影响已有的其他表字段的设置。如下图所示:

需要注意的是:字段变更会有以下两种情况:

(1)新增字段,同步数据结构,对原有数据集不会有任何影响。

(2)字段名称变更,比如将A字段变更为AAA,那么在同步数据集之后,你会发现数据集中A和AAA会同时存在,如果A字段被使用或被查询,则会报错。这时候就需要把使用到A字段的地方都替换成AAA,同时在数据集中把A删掉。

5、数据集的分析与编辑傻傻分不清

不知道大家是否注意到数据集的右边有分析、编辑两种操作, 刚看到时我也有点懵...

后来就发现了编辑是对表结构进行操作,如构建关联模型、新建计算度量、同步表结构、新建钻取、维度类型切换、度量设置聚合方式、度量格式化显示等。

而数据集的分析则是在工作表中简单地对数据进行过滤筛选,如设置日期条件、分类汇总、排序、求和等过滤条件。

需要注意的是,这两个界面有点类似,如果先进入了分析界面,却发现需要做多表关联或者维度转换,可以从工作表左上角进入数据集编辑界面进行操作。

暂时总结到这里,后续有新的坑再继续整理,希望能给苦逼的分析师们带来一点帮助。如果遇到其他坑,也欢迎来讨论讨论。

文章链接:https://www.zhihu.com/org/a-li-yun-yun-qi-she-qu-48/activities

本文转载自:https://www.zhihu.com/org/a-li-yun-yun-qi-she-qu-48/activities

共有 人打赏支持
于溪落霞
粉丝 3
博文 27
码字总数 22851
作品 0
相爱相杀的数据分析师与产品经理

(欢迎转载到个人朋友圈,转载时请带原文链接,公众号和其他媒体转载前请私信联系本人获取授权) 之前答应大家的数据分析师和产品经理的故事,我终于来填坑啦~ 好歹赶在农历新年前完成了,当...

陈丹奕
2017/01/10
0
0
Quick BI助力云上大数据分析---深圳云栖大会

在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家陌停对大数据智能分析产品 Quick BI 进行了深入的剖析。大会现场的精彩分享也赢得观众们的一直认可和热烈的反响。 大数据分析...

云攻略小攻
03/30
0
0
阿里云Quick BI——让人人都成为分析师

在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家潘炎峰(陌停)对大数据智能分析产品 Quick BI 进行了深入的剖析。大会现场的精彩分享也赢得观众们的一直认可和热烈的反响。...

超级吴大龙
03/30
0
0
数据分析专家带你实战Quick BI

在2018云栖大会上,数据产品专家潘炎讲述了关于大数据可视化面临的挑战,并对Quick BI的核心能力进行了详细的刨析,最后对Qucik BI的未来发展做出了一定的规划。 数十款阿里云产品限时折扣中...

wanwlxmmd
05/07
0
0
数据分析八大禁忌,数据分析师必看的避邪宝典

感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定! 对商业智能BI、大数据分析挖...

天善智能
05/14
0
0
2017年12月云栖大会北京峰会参会记

因为路途遥远,要坐10小时的动车,所以提前了一天赶往京城。由于带足了设备,虽然路程有点远,但是一点也不无聊。平板还没上场,就已经到了北京。 第一次来北方,来过之后才知道,原来北方比...

浮生递归
2017/12/27
0
0
你终将被世界温柔以待

1 我出生在某个穷困的村落里,可以说是穷乡僻壤了,父亲兄弟三个和爷爷奶奶都挤在几间土坯房里。一下雨屋里就霹雳啪啦的奏乐,那是雨水滴在搪瓷盆里的声音,雨水混合着泥水从天花板的裂缝里滴...

乔兰伊雪
2017/09/16
0
0
领导总要多想想,到底我要想什么?职场新兵突围指南

感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定! 对商业智能BI、大数据分析挖...

天善智能
05/10
0
0
意大利电影《消逝的星星》(The Missing Star)

想不到意大利人拍了一部如此中国化的电影。 中国一家钢厂购买了意大利的旧设备,可是不知道里面的一个部件是坏的。意大利工人文森佐为了将这个事情告诉中国同行,孤身一人来到陌生的中国,他...

阮一峰
2007/04/15
0
0
我与开源的那些事-漫谈敏捷BI平台 BiPlatform-开篇

2014年10月31日是一个令人兴奋的日子,经过小伙伴们近半年的准备、奋战,凝聚了一线开发人员无数心血的新一代敏捷BI平台-BIPlatform终于落户github(https://github.com/Baidu-ecom/bi-platf...

david_yuxue
2015/04/18
0
3

没有更多内容

加载失败,请刷新页面

加载更多

下一页

HashMap? ConcurrentHashMap? 相信看完这篇没人能难住你!

前言 Map 这样的 Key Value 在软件开发中是非常经典的结构,常用于在内存中存放数据。 本篇主要想讨论 ConcurrentHashMap 这样一个并发容器,在正式开始之前我觉得有必要谈谈 HashMap,没有它...

crossoverJie
12分钟前
2
0
OSChina 周一乱弹 —— 你的朋友圈有点生锈了

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @Devoes :分享Trademark的单曲《Only Love (电视剧《妙手仁心 II》插曲)》: 《Only Love (电视剧《妙手仁心 II》插曲)》- Trademark 手机党少...

小小编辑
今天
249
9
【面试题】盲人坐飞机

有100位乘客乘坐飞机,其中有一位是盲人,每位乘客都按自己的座位号就坐。由于盲人看不见自己的座位号,所以他可能会坐错位置,而自己的座位被占的乘客会随便找个座位就坐。问所有乘客都坐对...

garkey
今天
1
0
谈谈神秘的ES6——(二)ES6的变量

谈谈神秘的ES6——(二)ES6的变量 我们在《零基础入门JavaScript》的时候就说过,在ES5里,变量是有弊端的,我们先来回顾一下。 首先,在ES5中,我们所有的变量都是通过关键字var来定义的。...

JandenMa
今天
2
0
arts-week1

Algorithm 594. Longest Harmonious Subsequence - LeetCode 274. H-Index - LeetCode 219. Contains Duplicate II - LeetCode 217. Contains Duplicate - LeetCode 438. Find All Anagrams ......

yysue
今天
2
0
NNS拍卖合约

前言 关于NNS的介绍,这里就不多做描述,相关的信息可以查看NNS的白皮书http://doc.neons.name/zh_CN/latest/nns_background.html。 首先nns中使用的竞价货币是sgas,关于sgas介绍可以戳htt...

红烧飞鱼
今天
1
0
Java IO类库之管道流PipeInputStream与PipeOutputStream

一、java管道流介绍 在java多线程通信中管道通信是一种重要的通信方式,在java中我们通过配套使用管道输出流PipedOutputStream和管道输入流PipedInputStream完成线程间通信。多线程管道通信的...

老韭菜
今天
1
0
AB 压力测试

Ubuntu 安装AB apapt-get install apache2-utils 使用AB 压力测试 -c 并发数 -n请求总数 ab -c 3000 -n 10000 http://localhost/test/index.php AB只能测试localhost 返回结果 This is Apac......

xiawet
今天
0
0
用Python绘制红楼梦词云图,竟然发现了这个!

Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦,绘制小...

猫咪编程
今天
1
0
Java中 发出请求获取别人的数据(阿里云 查询IP归属地)

1.效果 调用阿里云的接口 去定位IP地址 2. 代码 /** * 1. Java中远程调用方法 * http://localhost:8080/mavenssm20180519/invokingUrl.action * @Title: invokingUrl * @Description: * @ret......

Lucky_Me
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部