文档章节

数据分析工具,你选对了吗?

勿忘初心321
 勿忘初心321
发布于 2017/01/09 13:26
字数 1413
阅读 18
收藏 0

一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于提升效率。那么,哪款数据分析工具深受数据分析师们的青睐呢?

当然是 IBM 数据分析大家族里的Cognos Analytics Data Sets。

Data Sets是Cognos Analytics V11.0.4提供的一种新的数据门户,用于创建一个定制的、用户经常使用的items的集合。Data Sets从packages或data modules中创建。当Data Sets更新后,下次在仪表板或storytelling中使用的也将是最新的Data Sets版本。

通过从一个package或者一个data module中选择一个或多个列的方式定义Data Sets,并且可以使用过滤来减少记录数量。相当于对数据做了一个行和列的过滤,取得数据的子集。数据被提取出来存放在Cognos Analytics系统中。由于数据被缓存了,Data Sets可以提高查询效率,减少数据库的工作负载。也可以用Data Sets为数据保留一个特定时间的版本。

cognos

一起来看一下在仪表板中使用Data Sets的基本方法

首先,打开仪表板,选择FM package。

cognos

在下面的界面中定义Data Sets的行和列。

cognos

接下来,我们将介绍进阶的使用方法。

汇总明细值,抑制重复

当从package或者data module中创建Data Sets时,可以选择是否汇总明细值,抑制重复。当勾选了这个选项时,测量值会以显式包含在这个Data Sets中的最小粒度做一个汇总。例如,您的数据仓库中可能有一张数百万条记录的销售表,里面记录了各个销售商的销售数量,但是您只想对每个区域的销售数量进行分析。假设您的数据集中只包含了“区域”和“销售数量”这两列,并且您勾选了“汇总明细值,抑制重复”,那么这个Data Sets中将只包含和您的“区域”数量相当的记录数。

请注意观察比较下面的两张图,勾选了汇总的图中“Quantity”列的数值比没有勾选汇总的图中的“Quantity”列的数值大得多,这是因为前者做了一个Group by的汇总计算。

cognos

cognos

使用这个选项的好处是,它可以将数据集压缩到更少的行,这可以带来更好的性能。但是,当您需要在分析中关注信息细节的时候就不要使用这个选项。

刷新Data Sets

通过Cognos Analytics门户,您可以随时改变数据集的列和过滤器。您也可以随时更新它的数据,或者定义一张时间表自动刷新数据,例如每周、每天、每小时或每X分钟。

cognos

从Data Sets中创建Data Sets

通常我们是从data module中创建 Data Sets的,但其实也可以从Data Sets中创建Data Sets。每个Data Sets都允许您进一步的连接、汇总和预计算数据。使用这种方法您可以在汇总数据的基础上进一步汇总。您可以将数亿条记录通过汇总削减成更适合专题探索的信息。

Data Sets的控制

DataSets和包括底层数据库在内的所有系统都是分隔的,因此数据库管理员不必担心对Data Sets的查询会消耗数据库系统的运算资源。通过使用过滤器非常容易控制Data Sets 的大小。Cognos管理员可以限定单个Data Sets的大小和系统上任何一个用户可以占用的总量。Cognos管理员也可以控制谁可以创建Data Sets。如果仪表板使用的Data Sets比较小,那么响应速度就非常快。

在Cognos 环境之间移动Data Sets

可以把Data Sets从一个Cognos Analytics环境转移到另一个环境。如果您需要把开发环境中经过测试的Data Sets发布到生产环境中,首先要在开发环境中创建一个包含了有Data Sets的那些文件夹的“Deployment”。如果希望包含提取的数据,需要勾选“Include reportoutput versions”,否则只有Data Sets 的元数据信息。之后再将这个“Deployment”导入到生产环境中。

Data Sets替换Data Modules的快照模式

Cognos Analytics的先前版本在Data Modules中提供了一个快照模式选项,这种方式会提取所有数据。在11.0.4 中此快照模式不再可用,它已经被Data Sets 替代。在先前版本中设置为快照模式的Data Modules将升级到11.0.4及更高版本中的“live”/“regular” data modules。与现在已弃用的快照模式相比,数据集具有以下优点:

  • Data Sets提供了提取汇总值或详细值的选项。
  • Data Sets将数据存储为单个表,而快照模块为模块中的每个表存储单独的文件。 在其他条件相同的情况下,不要求Join的查询将更快。
  • 可以将Data Modules的子集提取到Data Sets中。
  • Data Sets可以按照计划定时刷新。

看完以上的对于Data Sets的深度介绍,作为数据分析师的你,有没有跃跃一试的感觉?不想每天加班做数据分析的你,快来使用Data Sets来提高你的工作效率。

更多大数据与分析相关行业资讯、解决方案、案例、教程等请点击查看>>>

 

© 著作权归作者所有

勿忘初心321
粉丝 16
博文 105
码字总数 180970
作品 0
江北
私信 提问
PM skill 产品社区 3月11 精选

▍产品&运营 1、蚂蚁森林真的只是个小游戏吗? https://www.pmskill.net/topic/5c85bd378ffaed12cb304002 2、闲话商业模式,告诉你各行业赚钱的秘密 https://www.pmskill.net/topic/5c85bb10...

PMskill产品社区
03/11
0
0
Arcgis Server 基于GP 服务的最短路径分析配置

基于GP 服务的最短路径分析配置 一. 网络数据的制作发布 1. 用Catalog,发布network网络数据 2. 数据名称任意 3. 选择道路图层 4. 设置联通属性 5. 此处设置道路起止点位置的有效值,End P...

sinat_34719507
2017/03/06
0
0
Java报表里面的一些使用问题

自从ireport停止新功能开发后,就尝试用其他报表工具了。jreport虽然不开源,不过试用版免费,就下来试了试。 jreport资源不多,但是他的制作过程还是比较轻松,这里总结了下使用心得: 一、...

冬四拉
2014/05/13
227
0
JChromium Updater

JChromium Updater 是一个刚刚诞生5天的 Chromium 更新工具,由于其采用 Java 技术,也使得该工具可以支持多种平台。目前来看这款工具还只支持安装版 Chromium 的更新,即使选对了路径也不能...

鉴客
2011/01/11
982
0
arcgis10.3降雨量等值线图制作过程

Arcgis10.3降雨量等值线图制作过程教程 1.加载站点、边界、高程、降雨量值等数据 2.右键雨量站点图层,连接雨量数据 打开雨量站点图层的属性表,检查是否关联成功。 4.点开arctoolbox,在spa...

sinat_34719507
2017/03/06
0
0

没有更多内容

加载失败,请刷新页面

加载更多

MySQL8.0.17 - Multi-Valued Indexes 简述

本文主要简单介绍下8.0.17新引入的功能multi-valued index, 顾名思义,索引上对于同一个Primary key, 可以建立多个二级索引项,实际上已经对array类型的基础功能做了支持 (感觉官方未来一定...

阿里云官方博客
38分钟前
4
0
make4.1降级 make-3.81、2错误

在编译 make-3.82 的时候出现如下错误提示 glob/glob.c:xxx: undefined reference to `__alloca'` 修改 /glob/glob.c // #if !defined __alloca && !defined __GNU_LIBRARY__ # ifdef __GNUC......

Domineering
40分钟前
7
0
Rainbond集群的安装和运维的原理

本文将解读Rainbond集群的安装和运维的原理,使用户基本了解Rainbond的安装机制和运维重点,便于用户搭建大型Rainbond集群。 1.Rainbond集群节点概述 1.1 节点分类 属性 类型 说明 manage 管...

好雨云帮
51分钟前
8
0
好程序员大数据学习路线分享UDF函数

1.为什么需要UDF? 1)、因为内部函数没法满足需求。 2)、hive它本身就是一个灵活框架,允许用自定义模块功能,如可以自定义UDF、serde、输入输出等。 2.UDF是什么? UDF:user difine fun...

好程序员官方
53分钟前
6
0
Groovy中 Base64 URL和文件名安全编码

Base64 URL和文件名安全编码 Groovy支持Base64编码很长一段时间。 从Groovy 2.5.0开始,我们还可以使用Base64 URL和Filename Safe编码来使用encodeBase64Url方法对字节数组进行编码。 结果是...

白石
57分钟前
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部