文档章节

揭秘阿里云EB级大数据计算引擎MaxCompute

阿里云云栖社区
 阿里云云栖社区
发布于 2018/12/06 16:03
字数 1277
阅读 42
收藏 0

日前,全球权威咨询与服务机构Forrester发布了《The Forrester WaveTM: Cloud Data Warehouse, Q4 2018》报告。这是Forrester Wave首次发布关于云数仓解决方案(Cloud Data Warehouse,简称CDW)的测评。报告对云数仓的当前产品功能、产品路线和发展策略、市场表现等几个方面进行全面的评估,在产品能力排行榜中,阿里云力压微软排行第7。

abb4093bf2dfa67c76529a81eb1be6ff5918dd88

Forrester测评报告对CDW核心功能的评估主要从解决方案的多样性、数据集成、性能和弹性扩展、安全性等方面进行,Forrester给出的评价是:阿里云(MaxCompute+DataWorks+ADB)在广泛的基础设施之上提供了一个可靠的数据分析平台,能够满足客户实时和EB规模的数据处理需求。此前媒体已经报道了DataWorks的相关细节,今天我们就来聊聊MaxCompute。

EB级数据处理能力

首先来看一组数据。

2018年双11,MaxCompute单日数据处理超过600PB,平稳支撑电商混布单元在线流量洪峰12万笔/s交易,稳定承载45%导购流量,为双11交易峰值提供了有力保障和平滑支撑。

根据官方介绍,MaxCompute是一种快速、完全托管的数据仓库解决方案,通俗地理解就是大型分布式数据计算,所以大规模计算是最基础的能力。MaxCompute已经是阿里巴巴的主力计算平台,支持了整个阿里巴巴集团内部99%的大数据存储和95%的计算,数据规模已达到EB级,上文提到的双11场景就很好地体现了规模这能力。

 

 

cd9b821027b5658039e93652cbe0596512d78d08

当然,它和传统 Hadoop 相比还有其它的优势。MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。

整体来说有如下特点:

 ●  MaxCompute在计算引擎、分布式存储上做了优化,在Sort Benchmark中MaxCompute消耗的时间和成本都是最低,保证了最优性价比。

 ●  服务器资源、集群规模都是动态的弹性拓展,无需用户关心。

 ●  支持SQL、MR、迭代计算、内存计算、图计算等计算模型。

a182a3970ecde72096aa37b9f634d9a582ecdf4d

经历大规模应用实践

据了解,目前MaxCompute正在为全球企业提供大数据计算能力。阿里巴巴通用计算平台负责人关涛曾表示,“在公共云上,MaxCompute每年以250%的用户量和计算量在增长,并在全球十几个国家和地区部署服务,为当地企业提供计算力。”

例如,城市大脑的底层就在使用MaxCompute做存储和大数据计算,支持了杭州、澳门、吉隆坡等城市进行智能化升级。这其中,由MaxCompute、PAI、流计算服务组成的计算平台发挥了巨大的价值。

1

不仅如此,MaxCompute在各大行业已经有广泛应用:

天气预测有着广泛的需求群体,每天几亿次的天气查询需求和近几十亿次的广告请求, MaxCompute则很好地应对了这一挑战。MaxCompute帮助墨迹天气实现了对每天上亿用户的天气查询需求的快速响应和几十亿次广告请求的精准投放。 互联网保险行业,MaxCompute帮助众安实现精准的用户画像分析,助力企业为数亿用户提供数十亿的保单服务,提升企业效率的同时,为亿万用户送去健康与安全。

总而言之,只要有海量数据处理需求的场景,MaxCompute都能通过阿里云为用户提供快速、稳定的计算能力。

结语

从Forrester的本次研究报告可以看出,大数据技术已经进入CDW阶段,在广泛的基础设施之上提供一个可靠的数据分析平台,满足客户实时和大规模数据计算成为核心需求。

MaxCompute作为大数据计算平台,不只是单一引擎,更是面向企业的完整服务。在过去10年中,MaxCompute稳定支撑阿里集团所有数据业务的同时,早已将强大的数据能力普惠给广泛的云上企业。基于MaxCompute构建稳定、安全、可扩展及与应用系统高效交互的数据中台,已成为众多行业下客户数字转型的首选方案。

作者: 隐林
原文链接
本文为云栖社区原创内容,未经允许不得转载。

© 著作权归作者所有

阿里云云栖社区
粉丝 454
博文 1558
码字总数 3823668
作品 0
朝阳
私信 提问
大数据计算成都峰会—开启西南大数据新洞察

阿里巴巴大数据计算服务MaxCompute走进西南,邀您共赴成都大数据计算峰会。 现在报名>>> 为进一步满足西南地区的计算需求,阿里云大数据计算服务MaxCompute即将在成都正式开服。云贵川及周边...

晋恒
2018/08/29
0
0
DCA公布第七批大数据产品能力评测结果,阿里云MaxCompute超大规模集群引关注

2018年11月30日,为期两天的数据中心联盟第七批大数据产品评测结果评审会圆满结束。本次评审委员会由中国信息通信研究院、清华大学、中国科学院、北京邮电大学、中移信息、国电投、中国银行、...

晋恒
2018/12/03
0
0
双11奇迹背后的大数据平台,不喧哗,自有声!

00:02:05 成交额超100亿 00:57:56 成交额超666亿 01:47:26 成交额超1000亿 15:49:39 成交额超1682亿 22:28:37 成交额超2000亿 2018年双11新纪录2135亿 高速跳转的数字,不断刷新的状态,光缆...

迷你芊宝宝
2018/11/23
17
0
2017杭州云栖大会100位大咖视频+讲义全分享 大数据

摘要: “如果我看得更远一点的话,是因为我站在巨人的肩膀上。”2017杭州云栖大会资料全部整理完毕,首批100位大咖视频+讲义分享给大家。 杭州云栖大会是阿里集团一年一度的全生态科技盛会。...

qq_40954115
2017/11/06
0
0
大数据计算杭州高端峰会—探寻真正的“大数据,云计算”

阿里巴巴大数据计算服务MaxCompute携手阿里云MVP 邀您共赴杭州大数据计算高端峰会,探寻真正的“大数据,云计算” 现在报名>>> 你也有这些需求和疑惑吗? 如果你在杭州,那就来现场倾听、交流...

晋恒
2018/07/10
0
0

没有更多内容

加载失败,请刷新页面

加载更多

前端技术之:Prisma Demo服务部署过程记录

安装前提条件: 1、已经安装了docker运行环境 2、以下命令执行记录发生在MackBook环境 3、已经安装了PostgreSQL(我使用的是11版本) 4、Node开发运行环境可以正常工作 首先需要通过Node包管...

popgis
33分钟前
4
0
数组和链表

数组 链表 技巧一:掌握链表,想轻松写出正确的链表代码,需要理解指针获引用的含义: 对指针的理解,记住下面的这句话就可以了: 将某个变量赋值给指针,实际上就是将这个变量的地址赋值给指...

code-ortaerc
48分钟前
4
0
栈-链式(c/c++实现)

上次说“栈是在线性表演变而来的,线性表很自由,想往哪里插数据就往哪里插数据,想删哪数据就删哪数据...。但给线性表一些限制呢,就没那么自由了,把线性表的三边封起来就变成了栈,栈只能...

白客C
今天
40
0
Mybatis Plus service

/** * @author beth * @data 2019-10-20 23:34 */@RunWith(SpringRunner.class)@SpringBootTestpublic class ServiceTest { @Autowired private IUserInfoService iUserInfoS......

一个yuanbeth
今天
5
0
php7-internal 7 zval的操作

## 7.7 zval的操作 扩展中经常会用到各种类型的zval,PHP提供了很多宏用于不同类型zval的操作,尽管我们也可以自己操作zval,但这并不是一个好习惯,因为zval有很多其它用途的标识,如果自己...

冻结not
昨天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部