加载中
Apache Hudi 在袋鼠云数据湖平台的设计与实践

在大数据处理中,实时数据分析是一个重要的需求。随着数据量的不断增长,对于实时分析的挑战也在不断加大,传统的批处理方式已经不能满足实时数据处理的需求,需要一种更加高效的技术来解决这...

从5分钟到60秒,袋鼠云数栈在热重启技术上的提效探索之路

更好地提高效率一直以来是袋鼠云数栈产品的主要目标之一。当前数栈客户的实时任务都是基于 Per-Job 模式运行的,客户在进行一些任务参数的修改之后,只能先取消当前任务,再选择 CheckPoint...

详细剖析|袋鼠云数栈前端框架Antd 3.x 升级 4.x 的踩坑之路

袋鼠云数栈从2016年发布第⼀个版本开始,就始终坚持着以技术为核⼼、安全为底线、提效为⽬标、中台为战略的思想,坚定不移地⾛国产化信创路线,不断推进产品功能迭代、技术创新、服务细化和性...

03/03 17:35
1K
看这篇就够了丨基于Calcite框架的SQL语法扩展探索

Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。 但是不...

Iceberg在袋鼠云的探索及实践

“数据湖”、“湖仓一体”及“流批一体”等概念,是近年来大数据领域热度最高的词汇,在各大互联网公司掀起了一波波的热潮,各家公司纷纷推出了自己的技术方案,其中作为全链路数字化技术与服...

数据安全新战场,EasyMR为企业筑起“安全防线”

2020年1月,时间跨度长达14年的,微软2.5亿条客户服务和支持记录在网上泄露; 同年4月,微盟发生史上最贵“删库跑路”事件,造成微盟市值一夜之间缩水约24亿港币; 今年7月,网信办依据《数据...

袋鼠云平台代码规范化编译部署的提效性改进实践

一、前言 作为全链路数字化技术与服务提供商,袋鼠云提供了从数据湖、大数据基础平台、离线开发、实时开发、数据服务、数据治理、指标管理、客户数据洞察、数据孪生可视化等全产品体系的服务...

从Multirepo到Monorepo 袋鼠云数栈前端研发效率提升探索之路

一、困境频生 前端代码管理何解? 前端代码管理一直是困扰不少前端开发团队的难题,从开发到发布的整体工作流程中,除了常规的技术问题外,往往还伴随着沟通成本、维护成本及协作效率等问题。...

袋鼠云数栈基于CBO在Spark SQL优化上的探索

原文链接:袋鼠云数栈基于CBO在Spark SQL优化上的探索 一、Spark SQL CBO选型背景 Spark SQL的优化器有两种优化方式:一种是基于规则的优化方式(Rule-Based Optimizer,简称为RBO);另一种是...

从容器化到资源池化,数栈云原生技术实践探索之路

导读: 近些年随着云计算和云原生应用的兴起,容器技术可以很好地解决许多问题,所以将大数据平台容器化是一种理想的方案。本文将结合袋鼠云数栈在Flink on Kubernetes的实践让您对大数据平台...

两步实现让antd与IDE和睦相处的处理案例

导读: Web IDE的开发从来是整个大数据平台开发中非常繁复和笨重的一环,从零搭建一个 Web IDE 通常意味着大量的殚精竭虑和苦思冥想,时间成本更是不可计数。两个UI组件库一起用更是bug的代名...

数栈在湖仓一体上的探索与实践

导读: 大数据技术的发展历程中,继数据仓库、数据湖之后,大数据平台的又一革新技术——湖仓一体近年来开始引起业内关注。市场发展催生的数据管理需求一直是数据技术革新的动力。比如数据仓...

ko在数栈中的应用

引言 一项技术能得以广泛运用,其中的一个关键点在于工程化。前端从最开始的简单写写网页和样式,发展为需要处理复杂的逻辑,伴随而来的是问题是相关文件越来越多,简单在网页中引用已经解决...

X6在数栈指标管理中的应用

一、需求背景 产品成立之初,产品的需求是需要对各种指标进行公式运算,组合成一个新的复合指标,供后续使用。当时产品提出的形式是有两种: 一种是直接让用户输入,不作任何其他操作,但这种...

g6
2022/02/16 10:48
1.2K
流批一体技术框架探索及在袋鼠云数栈中的实践

一、关于流批一体数据仓库 流批一体是一种架构思想,这种思想说的是同一个业务,使用同一个sql逻辑,在既可以满足流处理计算同时也可以满足批处理任务的计算。 从效率层面来说,批处理只能以...

Form 表单在数栈的应用(下):深入篇

这篇文章的主题为我们对 Form 表单在数栈产品中使用之后理解消化的一个过程,通过介绍一些 Form 表单中常用到的方法,来理解部分设计思想,加深我们对技术的追求。主要介绍 Form 表单的创建和...

Form 表单在数栈的应用(上): 校验篇

一、引言 本文为主题即为 Form 表单在数栈的应用,旨在希望能通过一些在数栈已经应用的实例和笔者整理的小tips来帮助大家更深入的理解Form表单校验、以及联动校验的认知和做法。 本文的重点为...

2022/01/12 15:59
3.8K
关于ant design pro的权限方案设计

访问控制(Access control)是指对访问者向受保护资源进行访问操作的控制管理。该控制管理保证被授权者可访问受保护资源,未被授权者不能访问受保护资源。 现实生活中的访问控制可以由付费或...

2022/01/05 20:35
5.5K
Molecule在GitHub与Gitee正式开源

铛铛铛 12月16日9:00 我们的Molecule在GitHub与Gitee 正式开源咯!!! 什么?你还不知道它是谁? 那就先来认识一下这位新成员吧 ps:悄悄告诉你 关注“数栈研习社”还有小惊喜哦 Molecule简...

重磅预告 | 开源家族又添新成员!12月16日Molecule在Github、Gitee等你

随着全球开源生态的持续性发展,开源项目数量呈现指数级的增长,并逐渐覆盖全栈技术领域。袋鼠云数栈技术开源团队一直秉承着“源于开源 回馈开源”的理念,坚持以技术为核心,开源开放、不断...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部