加载中
挑战最全 Apache Doris 学习资料,你想要的都在这里了!

写在前面: 感谢各位对 Apache Doris 的喜爱,针对大家的学习和使用需求,我们从互联网上整理汇总了 Apache Doris 相关的学习资料,包括但不限于:使用教程、技术解析、应用实践、大会回放及...

Apache Doris 1.1 特性揭秘:Flink 实时写入如何兼顾高吞吐和低延时

导读:随着数据实时化需求的日益增多,数据的时效性对企业的精细化运营越来越重要,使得实时数仓在这一过程中起到了不可替代的作用。本文将基于用户遇到的问题与挑战,揭秘 Apache Doris 1.1...

开源指南|如何从零开始参与 Apache 顶级开源项目?(一)

写在开头 从 2021 开始,有一个很有意思的说法经常在各大技术媒体或开源论坛中出现,「开源正在吞噬一切」。不论是否言过其实,从一个行业从业者的切身感知来看,开源确实从少数极客的小众文...

2022/08/30 14:41
7.4K
从 Elasticsearch 到 Apache Doris,构建 10 倍性价比提升的新一代日志存储分析平台

作者介绍: 肖康,SelectDB 技术副总裁 导语 日志数据的处理与分析是最典型的大数据分析场景之一,过去业内以 Elasticsearch 和 Grafana Loki 为代表的两类架构难以同时兼顾高吞吐实时写入、...

如何进行 Apache Doris 集群 Docker 快速部署

作者:苏奕嘉|SelectDB 生态研发工程师 Docker 容器化部署是当前最常见的部署方式之一,具有创建简单、快速部署、移植性强等特点,可极大节省应用开发、测试和部署时间,一次构建,随处运行...

2022/09/20 10:54
6.7K
下一个十年,我们需要一款什么样的分析型数据库?

本文来自于 Doris Summit 2022 演讲实录,演讲人:陈明雨 十年对于数据库意味着什么? 身处在日新月异的时代,我们见惯了技术的兴起与繁荣、变迁与衰落,甚至是朝荣夕灭。信息技术以前所未有...

01/10 11:10
6.7K
Apache Doris 冷热分层技术如何实现存储成本降低 70%?

在数据分析的实际场景中,冷热数据往往面临着不同的查询频次及响应速度要求。例如在电商订单场景中,用户经常访问近 6 个月的订单,时间较久远的订单访问次数非常少;在行为分析场景中,需支...

Java UDF 的设计与使用介绍,兼容 Hive UDF 实现数据快速迁移

作者介绍: 李仕杨,SelectDB 生态研发工程师,Apache Doris Contributor。 我们在使用各个 SQL 引擎时,会遇到纷繁复杂的查询需求。一部分可以通过引擎自带的内置函数去解决,但内置函数往往...

01/13 18:50
6K
百亿大表 Join 提速 300倍!Apache Doris 在约苗数据平台的实时数仓建设实践

本文导读: 约苗平台是国内目前最大的成人预防接种管理服务平台。近年来,随着各功能的不断完善,用户数量不断增多,越来越多注册数据、疫苗类别点击数据、页面浏览时长等数据被生成和积累,...

赋能直播行业精细化运营,斗鱼基于 Apache Doris 的应用实践

作者|韩同阳,斗鱼资深大数据工程师、OLAP 平台负责人 斗鱼是一家弹幕式直播分享网站,为用户提供视频直播和赛事直播服务。斗鱼以游戏直播为主,也涵盖了娱乐、综艺、体育、户外等多种直播内...

技术解析|Doris Connector 结合 Flink CDC 实现 MySQL 分库分表 Exactly Once精准接入

导读:本篇文档将演示如何使用 Apache Doris Flink Connector 结合 Flink CDC 以及 Doris Stream Load 的两阶段提交,实现 MySQL 数据库分库分表实时高效接入,并实现 Exactly Once。 作者|...

2022/07/18 19:10
3.9K
同程数科基于 Apache Doris 构建统一实时数仓,查询提速数十倍!

本文导读: 同程数科是同程集团旗下的旅游产业金融科技服务平台,为上下游企业和个人消费者提供数字金融科技服务。近年来,随着同程数科业务的不断拓展和用户量的增加,高效可靠的一站式数据...

10x 查询性能提升,全新 Unique Key 的设计与实现|1.2 新版本解读

作者:张晨 SelectDB 资深研发工程师 在实时数据仓库的业务场景中,能够友好支持数据的实时更新是一个非常重要的能力。例如在数据库同步(CDC)、电商交易订单、广告效果投放、营销业务报表等...

如何高效解决 C++内存问题,Apache Doris 实践之路|技术解析

导读:Apache Doris 使用 C++ 语言实现了执行引擎,C++ 开发过程中,影响开发效率的一个重要因素是指针的使用,包括非法访问、泄露、强制类型转换等。本文将会通过对 Sanitizer 和 Core Dum...

2022/09/05 18:15
3.4K
杭银消金基于 Apache Doris 的统一数据查询网关改造

导读: 随着业务量快速增长,数据规模的不断扩大,杭银消金早期的大数据平台在应对实时性更强、复杂度更高的的业务需求时存在瓶颈。为了更好的应对未来的数据规模增长,杭银消金于 2022 年 ...

技术干货|如何将 Pulsar 数据快速且无缝接入 Apache Doris

导读:Apache Doris Routine Load 支持了将 Kafka 数据接入 Apache Doris,并保障了数据接入过程中的事务性操作。Apache Pulsar 定位为一个云原生时代企业级的消息发布和订阅系统。那么 Apac...

2022/08/03 15:28
3.1K
查询性能较 Trino/Presto 3-10 倍提升!Apache Doris 极速数据湖分析深度解读

从上世纪 90 年代初 Bill Inmon 在《building the Data Warehouse》一书中正式提出数据仓库这一概念,至今已有超过三十年的时间。在最初的概念里,数据仓库被定义为「一个面向主题的、集成的...

一文揭秘高效稳定的 Apache Doris 内存管理机制

作者:SelectDB 高级研发工程师、Apache Doris Committer 邹新一 背景 Apache Doris 作为基于 MPP 架构的 OLAP 数据库,数据从磁盘加载到内存后,会在算子间流式传递并计算,在内存中存储计算...

05/25 14:34
2.9K
更高性能表现、更低资源占用,高精度计算数据类型 DecimalV3 揭秘

数值运算是数据库中十分常见的需求,例如计算数量、重量、价格等,为了适应多样化运算场景,数据库系统通常支持精准的数字类型和近似的数字类型,当我们需要精确地表示小数并计算小数时,通常...

资源消耗降低 90%,速度提升 50%,解读 Apache Doris Compaction 最新优化与实现

背景 LSM-Tree( Log Structured-Merge Tree)是数据库中最为常见的存储结构之一,其核心思想在于充分发挥磁盘连续读写的性能优势、以短时间的内存与 IO 的开销换取最大的写入性能,数据以 ...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部