加载中
DeltaLake在工业大脑的实践分享

作者介绍 占怀旻,花名心渡,阿里云数字产业产研部-工业大脑团队的大数据工程师,目前的工作方向是利用大数据与AI技术,为工业企业客户构建数据中台,支撑工业企业的数字化转型和智能制造落地...

精彩回顾 | 大数据+AI Meetup 2020 第二季 ·上海站(附PPT下载)

11月1日,大数据+AI Meetup 第二季·上海站成功举办!来自阿里巴巴、DellEMC、Databricks、滴滴、bilibili、StreamNative、上海力萌的9位技术专家齐聚魔都,集中解读上半年大数据的热门话题。...

10月29日社区直播【Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析】

主题: Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析 时间: 10月29日 19:00 观看方式: 扫描下方二维码进钉钉群 或者登陆直播间(即回看链接) https://developer.aliy...

议题解读|大数据+AI meetup 2020第二站·上海站

大数据+AI meetup 2020第二站·上海站报名正在火热进行,300入场名额一抢而空,紧急补货中。因场地位置有限,本次若报名未被选中,请持续关注我们后续的系列活动以及直播~ 报名抢入场券:h...

下半年你关心的行业热点都在这里,BIGDATA+AI Meetup 2020第二站·上海站开启报名!

金秋桂花香,正是上海相聚好时节。还记得盛夏降临时我们举办的大数据+AI Meetup第一站吗,虽然疫情当前采用了线上直播的形式,但是我们仍然邀请了来自阿里巴巴、Databricks、快手、网易云音乐...

大数据上手实战!训练营“9营齐开”第二季限时免费报名啦

8月18日,阿里巴巴大数据训练营“九营齐开”正式开营,来自数据计算、数据分析、数据仓库、搜索、机器学习、数据智能等多个领域的技术大佬亲身上阵教学,解读各技术领域基础原理,剖析行业实...

10月15日社区直播【Intel MLlib:构建平台优化的Spark机器学习】

主题: Intel MLlib:构建平台优化的Spark机器学习 时间: 10月15日 观看方式: 扫描下方二维码进钉钉群 或者登陆直播间(即回看链接) https://www.slidestalk.com/m/303 讲师: 吴晓昶 英特...

基于OSS的EB级数据湖

背景 随着数据量的爆发式增长,数字化转型成为整个IT行业的热点,数据也开始需要更深度的价值挖掘,因此需要确保数据中保留的原始信息不丢失,从而应对未来不断变化的需求。当前以oracle为代...

Spark大咖说:MLFlow和spark在机器学习方面的进展、Project Hydrogen和spark在深度学习方面的进展

直播主题: MLFlow和spark在机器学习方面的进展、Project Hydrogen和spark在深度学习方面的进展 时间: 6月19日 19:30-20:30 分享嘉宾: 江宇,阿里云EMR技术专家。从事Hadoop内核开发,目前...

EMR Spark Relational Cache的执行计划重写

作者:王道远,花名健身, 阿里巴巴计算平台EMR技术专家。 背景 EMR Spark提供的Relational Cache功能,可以通过对数据模型进行预计算和高效地存储,加速Spark SQL,为客户实现利用Spark SQL...

基于Spark SQL实现对HDFS操作的实时监控报警

作者:木艮,阿里云E-MapReduce开发工程师 1.前言 E-MapReduce计划从EMR-3.18.1版本开始提供Spark Streaming SQL的预览版功能。Spark Streaming SQL是在Spark Structured Streaming的基础上做...

Spark Streaming 框架在 5G 中的应用

原文链接: https://www.ericsson.com/en/blog/2019/6/applying-the-spark-streaming-framework-to-5g 编译: 明柏,阿里巴巴计算平台事业部EMR团队技术专家,Apache Spark Contributor,目前...

钉钉群直播【Spark Relational Cache 原理和实践】

直播主题: 【Spark Relational Cache 原理和实践】 时间: 6月26日 19:00-20:00 分享嘉宾: 李呈祥,阿里巴巴计算平台事业部EMR团队的高级技术专家,Apache Hive Committer, Apache Fli...

通过Spark SQL实时归档SLS数据

作者:木艮,阿里云E-MapReduce开发工程师 我在前一篇文章介绍过基于Spark SQL实现对HDFS操作的实时监控报警。今天,我再举例说明一下如何使用Spark SQL进行流式应用的开发。本文主要分成三部...

Spark内置图像数据源初探

作者:林武康,花名知瑕, 阿里巴巴计算平台事业部EMR团队的高级开发工程师,Apache HUE Contributor, 参与了多个开源项目的研发工作,对于分布式系统设计应用有较丰富的经验,目前主要专注于...

使用Spark SQL进行流式机器学习计算(上)

作者:余根茂,阿里巴巴计算平台事业部EMR团队的技术专家,参与了Hadoop,Spark,Kafka等开源项目的研发工作。目前主要专注于EMR流式计算产品的研发工作。 今天来和大家聊一下如何使用Spark...

通过WebUI查看Structured Streaming作业统计信息

作者:余根茂,阿里巴巴计算平台事业部EMR团队的技术专家,参与了Hadoop,Spark,Kafka等开源项目的研发工作。目前主要专注于EMR流式计算产品的研发工作。 1. 前言 从EMR-3.18.1版本开始,E...

EMR Spark Relational Cache如何支持雪花模型中的关联匹配

作者:李呈祥,阿里巴巴计算平台事业部EMR团队高级技术专家,Apache Hive Committer, Apache Flink Committer,深度参与了Hadoop,Hive,Spark,Flink等开源项目的研发工作,对于SQL引擎,分...

钉钉群直播【Koalas 介绍】

直播主题: 【Koalas 介绍】 时间: 7月3日 19:00-20:00 分享嘉宾: 王道远(健身):阿里云EMR技术专家,Apache Spark活跃贡献者,主要关注大数据计算优化相关工作。 内容介绍: Koalas简...

社区直播【E-MapReduce产品探秘系列(一)(二))】

怎样从集群相关的各种繁琐的采购、准备、运维等工作中解放出来,相对方便可控的手段,从各方面管理自己的集群;如何优化云上使用成本······本次我们邀请了阿里云开源大数据平台EMR的产...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部