openGauss亮相DTC 2023 | 全程精彩回顾

2023/04/11 19:30
阅读数 74

4月8日下午,为期两天的第十二届数据技术嘉年华(DTC 2023)在北京新云南皇冠假日酒店圆满落下帷幕。大会得到了工业和信息化部电子五所的支持和指导,围绕“开源·融合·数字化——引领数据技术发展,释放数据要素价值”这一主题,汇聚“产学研”各界数据技术领军人物、学术精英、技术专家、行业用户,从多角度、多维度带来68场主题演讲。openGauss作为大会的重要合作伙伴,有四位专家分别在主论坛和专题论坛发表演讲。

践行使命,持续创新突破数据库核心技术

CCF数据库专委会副主任,openGauss社区技术委员会主席,清华大学计算机系副主任、长聘教授李国良在4月7日上午的主论坛发表了题为《openGauss:聚焦数据库内核创新,共建开源数据库根社区》的演讲。在演讲中他提到:从2020年开源至今,openGauss 一直践行三个使命:核心技术的创新和探索,一直走在核心技术的突破上;建立数据库根生态和根社区,和合作伙伴一起构筑中国数据库;有引领性和创造性的思路,不是简单跟随其他数据库发展一些原有的技术。

从国内数据库的发展历程来看,五十多年间无论是数据库种类还是架构都发生了翻天覆地的变化。现如今这种变化主要呈现四个趋势:第一、数据量变得越来越大,这需要我们创造性的提出高性能的技术;第二、高可用的挑战,怎么让普通PC机像大机一样去使用;第三、现在的数据库慢慢都会走到云上,云上大量的实例需要提升数据库智能化的能力去运维;第四、安全性,怎么用数据库的核心技术来保证我们数据安全,而不是通过简单的法律法规和技术。

CCF数据库专委会副主任,openGauss社区技术委员会主席,清华大学计算机系副主任、长聘教授 李国良

践行三个使命,围绕四大趋势,李国良总结出openGauss的四大根技术 ,也就是 “四高”:高性能、高可用、高智能、高安全,openGauss一直在这四大方面持续创新和探索,提升数据库能力,使客户能够更加方便去使用数据库,在上面支撑各种应用。

随后,李国良教授在演讲中为大家介绍了在最新的5.0版本中围绕这四方面的创新技术:在高性能方面,通过智能基数估计、分层自适应并行查询技术、在线SQL Patch技术、智能线程调度算法、在线并行索引创建等技术,大幅提高索引创建效率、信息准确率,使得并行查询资源利用率最优;在高可用方面,实现了DCF自选主、双集群容灾、支持Logger节点、多节点实时一致性数据读取、多版本页面回放、并行逻辑解码深度优化等能力,使得效率、存储利用率倍增,RTO 大幅提升。在高智能方面,通过负载驱动的基数估计、分层式混合洗牌算法、基于DBMind自治平台的多指标关联性分析等技术,大幅提升数据库性能,实现运维效率倍数提升;在高安全方面,纯软密态能力升级,隐式范围索引结构创新,支持范围查询;软硬融合密态模糊索引技术,支持高效模糊(like)查询;基于注意力机制的异常行为检测技术,精准捕捉攻击行为;基于标签的访问控制,保证机密数据管控安全,防护等级更高。

深挖内核,用智能技术赋能数据库应用能力

随着智能技术的不断发展,AI技术也不断与数据库相结合,openGauss在这方面也做了很多的尝试,那么openGauss是如何构筑全系统的资质运维加上库内的AI引擎的?华为openGauss数据库AI领域负责人李士福在「数智趋势:智能运维与自治」专题论坛发表了题为《openGauss:自驾驶数据库内核》的演讲。为我们揭秘openGauss的智能能力主要包含两个子系统:AI4DB是利用AI的方法去使用数据库,DB4AI是数据库去赋能AI。

华为openGauss数据库AI领域负责人 李士福

AI4DB主要体现在两大方面:一个是DBMind自治运维系统,实现自优化、自安全、自监控、自诊断,是方便用户去做系统的运维诊断,去把系统做得更高效、可靠,提升数据库产品的性能和可用性。在这里,李士福老师详细讲解了DBMind自治运维系统的索引推荐能力、慢SQL诊断和建议、多指标关联分析能力;二是把AI技术嵌到数据库内核之中,当前聚焦在AI优化器这个方面包括智能查询重写、代价估计、行数估计、计划自适应选择等,以及存储引擎中的自学习索引、缓存自适应淘汰等能力。

DB4AI库内AI引擎就是把AI的算法直接内嵌到数据库中,通过对外进行SQL语言去为数据库提供AI能力,这样方便用户去使用训练和推理的语序,同时DB4AI还可以提供API接口,供学习型内核组件调用,把库内组件进行加速。

李士福通过几则案例对这两大智能模块做了深入讲解。在演讲的最后他呼吁道:“AI4DB和DB4AI其实是新兴领域,我们用AI4DB解决当前运维场景效率、用DB4AI提升用户使用价值,希望大家可以加入openGauss社区,共同把这个方向做得更好”

以史为鉴,探究更优的数据库架构规划

数字时代的今天,产业的数字化带来了丰富的应用场景和海量数据,由此带来的多样性应用场景和数据需要数据库支持多种算力和多模的数据处理能力。openGauss开源数据库首席架构师黄凯耀在题为《openGauss架构创新与新特性深度解读》中表示:“在这样的行业背景下,我们数据库应该怎么发展,它的架构又是怎么样的,这其实是我们要思考的问题。”

openGauss开源数据库首席架构师、社区技术委员会委员 黄凯耀

回顾历史,Oracle数据库内核首先叠加分布式计算,进而开发分布式存储和分布式内存能力。Google Cloud Spanner是在分布式存储首先叠加数据库内核能力,进而开发分布式计算和分布式内存能力。为有效应对现如今大规模数据库可靠性、性能、易用性诉求,openGauss数据库推出三层资源池化架构,数据库内核与计算层、内存层、存储池深度协同,面向数据基础设施,全栈融合创新。在计算池中,能够使用最佳的引擎满足不同业务处理诉求;内存池化,能够实现多节点数据实时一致,RDMA网络加速,SCM多级缓存等能力,带来卓越性能;在存储池中,支持企业级SAN存储、分布式存储,能够为TP/AP等不同业务场景提供最佳选择,存储效率上升50%以上,NDP近数计算性能提升2倍。

携手用户,深入赋能企业核心应用场景

民生银行作为openGauss的重要合作伙伴,早在openGauss刚刚发布的时候就加入了openGauss社区,在信创改造中有绝大数应用系统都是以openGauss作为改造对象;并在使用中不断将意见和建议回馈社区,帮助openGauss走向成熟。在DTC 2023,中国民生银行资深数据库专家孔再华在分论坛带来题为《openGauss在民生银行的应用实践》的演讲,讲述了在这场合作中民生银行的思考和行内架构设计。


在做数据库测试时可能大家都主要关注它的性能、功能,但到了部署层面,对数据库的要求无疑是稳定,因此高可用方案如何做就变得尤为重要。在双机的高可用方案里,有6个关键的设计点:本地进程守护、主库丢失切换、文件系统检测、双主检测自杀、主库孤单自杀、从库丢失检测。整个高可用方案基于比较成熟的、不断的经验积累而形成。

中国民生银行资深数据库专家 孔再华

关于部署的形态,孔再华首先介绍了一主一从的虚拟机方案。在这个方案里,虚拟机高可用漂移,主从不切换,同时,加入HA守护数据库进程,故障自动拉起,即便虚拟机某一个机器出现故障,仍能保障数据的一致性。另一个方案是物理机方案,和虚拟机方案一样,同样是同城双中心,物理机方案采用FIRST设置,可实现本地同城数据同步、本地HA激活故障切换,在同城HA非激活状态下,人工干预同城切换。

除了同城双中心的保护之外,民生银行在openGauss应用实践中还设计了常见的两地三中心的容灾方案。它采用一主一从的架构,在异地的机房里设置同等比例的服务器,通过使用openGauss主从复制的能力,以及一些可定制化的配置设计而成,可实现异地数据异步传输、异地级联复制、异地演练、异地切换。

除了主题演讲之外,设在大会现场的openGauss展位同样受到了与会者的高度关注,咨询者络绎不绝,这也从一个侧面体现了openGauss作为国内开源数据库根社区的火热程度。近三年来,社区的发展取得令人瞩目的成绩,现如今openGauss下载量已突破160万,社区汇聚了4500+开发者和230+企业成员,在8大关键行业均有落地,DTC 2023这场数据库年度盛会已经告一段落,我们期待下一次的相遇,届时我们将带来更加卓越的能力、更加优异的成绩!希望“产学研用”各界加入我们,一起共建、共享、共治开源数据库根社区。

本文分享自微信公众号 - openGauss(openGauss)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部