云原生趋势下的架构演进 | GIAC

2021/06/15 17:24
阅读数 26

《云原生——IT领域的“共享经济”》报告显示,2019年,以IaaS、PaaS和SaaS为代表的全球云计算市场规模达到1883亿美元,增速20.86%。预计未来几年市场平均增长率在18%左右,到2023年市场规模将超过3500亿美元,并且云服务支出占到了总潜在IT支出的占比也将由2017年的8%,提升至2021年21%,经过近十年的高速发展,云计算已发展到一个新的阶段,如何深化用云进一步提升云计算使用效能成为现阶段云计算发展的重点。云原生以其高效稳定、快速响应的特点极大地释放了云计算效能,成为企业数字业务应用创新的原动力,有效推动了国民经济的高质量发展。


云原生技术架构充分利用了云计算弹性、敏捷、资源池和服务化特性,在改变云端应用的设计、开发、部署和运行模式的同时,也带来了新的安全需求和挑战。那么,在前沿技术的潮流下,“新云原生企业”如何把握机遇,探索有效释放云价值的技术,更好的使用云原生,促进企业智能升级?


7月30-31日,由msup和高可用架构社区联合主办的GIAC全球互联网架构大会,邀请了84+架构师、技术负责人,分享云原生背后的思考和实践。除云原生的相关内容外,微服务、架构演进、高可用架构等经典案例也是业内广泛关注和重点投入的方向。以下是各专场的部分精彩案例,我们一起来看看:


案例背景:


1、统一通信协议

2、统一序列化协议

3、与其他框架互联互通

4、作为数据面融入云原生时代控制面事实标准 istio


听众收益:


1、了解国内第一微服务治理框架在云原生时代的思考

2、了解 dubbogo 和云原生热门技术的整合

3、了解 dubbogo 的后续方向和规划


案例背景:

 

商用高性能块存储系统(HPBSS)为计算服务(CCS)提供块存储服务,允许用户按需创建块设备并以存储卷的形式将其连接到其计算实例。存储卷全部或部分丢失的年故障率在0.1%到0.2%之间。HPBSS通过实施链式复制方案实现更高的数据持久性。数据链式地从计算实例的存储卷复制到主本,然后再到副本。当主本发生故障时,需要一个专门的配置服务,自动调整主副本的顺序和节点角色的更新,继续进行上述链式复制,确保数据的持久性。正常状况下,该配置服务处理的流量很小,无需联系配置服务。但当发生大规模故障(如电源或网络故障)时,大量节点失效,则需要通过配置服务保证块存储服务的强一致性,因为卷IO会一直阻塞直到复制完成,同时该配置服务的可用性也是保证HPBSS数据持久性的关键。然而CAP定理中可用性和一致性的互相限制,以及分布式系统实际的运行情况,使得该服务无法直接采用市面上已有的相关产品。


听众收益:


1、了解一个真实分布式系统设计与持续优化的过程

2、了解现实中如何同时实现系统的可用性和一致性

3、了解在架构设计中如何减小爆炸半径


案例背景:


1、超大规模

2、环境复杂,容器环境比较特殊,还要兼容物理机

3、协议复杂,要处理多种中间件协议,包括redis、mysql、grpc、http、zk等。


听众收益:


1、如何解决mesh落地超大规模的问题

2、如何解决mesh落地复杂环境的问题

3、如何将复杂sdk逻辑下沉到mesh中

4、mesh平台化建设

5、如何提高用户接入意愿


案例背景:


Kubernetes 集群几乎时刻都在产生事件,这些事件中包含的关键信息可能是后续线上故障的主要原因,而这部分事件通常不容易与故障指标进行关联。本案例将详细介绍 Apache SkyWalking 如何将 Kubernetes 产生的事件与 SkyWalking 本身的监控指标进行关联分析,帮助用户快速定位故障原因。


听众收益:


1、学习了解 Apache SkyWalking 在云原生场景下提供的强大的可观测性能力

2、学习利用 Kubernetes 事件来辅助分析系统故障和提供系统告警

3、获得使用 Apache SkyWalking 和 Kubernetes Event Exporter 进行系统监控最佳实践


案例背景:


腾讯会议在疫情期间业务井喷,用户规模和计算资源已经十分庞大,作为全民聚光灯下产品既要保障性能又要成本合理,通过云原生技术提升研发和运维效率势在必行。


听众收益:


1、了解如何实现无损变更?

2、了解如何增强发布能力?

3、了解如何实现多地域部署?


案例背景:


极栈 AI 平台 v1.0 是使用容器方式挂载指定GPU来分配算力,容器内置 Jupyter 在线IDE实现和开发者交互,开发者完成算法训练。随着算法开发需求越来越多,同时数据集是由用户真实场景提供,算法开发人员来自外部; 如何将算力资源利用率最大化,如何让外部算法开发人员完成训练又保障算法需求方客户数据集不外泄,如何低人力成本评估成千上万个算法的质量,一系列问题急需一套完整解决方案。


听众收益:


1、了解 AI 开发全生命周期

2、了解 AI 平台核心技术,AI 平台本质是一个 PaaS 平台,不懂深度学习等算法开发的同学完全可以参与到未来 AI 时代基础设施的核心开发建设中

3、了解 Kubernetes, KubeSphere 等云原生技术给 AI 平台带来的创新和价值

4、了解通用容器管理平台 KubeSphere 社区最新进展


案例背景:


云原生应用已经成为一种主流的应用形态,其天生利用云平台的大量基础性服务,让应用本身可轻易获得高可用、高扩展、高性能、高伸缩、高可信等能力。


但是云原生应用的开发也面临诸多挑战。其中一个巨大的挑战就是,云原生应用要利用云平台的基础性服务,不得不引入大量的服务特定SDK到应用当中。当云原生应用需要混合多种语言来开发,并且需要进行跨云部署(或者要做到云平台中立)的时候,整个云原生应用的开发难度将会成倍提高。


听众收益:


通过参与本课程,可以对Dapr进行一个全面的了解,并能在自己的实际项目开发中引入Dapr。


案例背景:


现行的开源社区的Service Mesh的服务治理是基于Kubernetes 的解决方案,因为其需要解决跨语言的问题,除了有一套自成体系的xDS的方案外,还要对所有的流量进行劫持,其巨大增加了整体架构的复杂度。而Java技术栈中天生有一套服务治理的解决方案,这个解决方案与现行的Service Mesh的解决方案并不一致,在两者进行相互配合时,会有很多问题。这里,我们讨论如果使用Service Mesh的架构模式和思路应用于Java技术栈。


听众收益:


了解前沿技术和云原生架构的最佳实践


案例背景:


拥有超过5亿月活跃用户的微博,聚集了海量的吃瓜群众、各行业大V、明星等多元用户,凭借庞大的用户基础,同时随着图文+视频内容形式的不断升级,微博已慢慢成为了全民吃瓜和讨论热门话题必不可少的平台之一。


听众收益:


1、大流量场景下,如何搭建微博视频中台架构

2、极度突增流量场景下,微博视频都做了哪些保障服务高可用

3、业务不断发展和快速迭代情况下,微博视频如何不断实现系统优化


案例背景:


公司调度系统每天运行着千万级别的任务调度,在实时性、可用性、稳定性、扩展性以及成本方面都面临着巨大的挑战。


听众收益:


1、了解如何构建高可靠的分布式调度系统

2、了解分布式任务队列的设计

3、了解如何有效构建系统的可见性体系以提升系统稳定性


案例背景:


1、随着业务增长,单机数据库的容量逐渐成为瓶颈,我们需要一个能自动扩缩容的分布式数据库

2、随着集群能存储的数据容量增多,逐渐有偏分析类的业务接上来,但计算性能却不足以支撑这类业务,我们需要一个列存引擎,最好能支持 MPP

3、TP 和 AP 业务混合的跑在同一个,没有资源隔离又可能互相干扰,AP 和 TP 需要有一个隔离的办法

4、在云上,数据库架构又将如何改变


听众收益:


1、了解 TiDB 的使用场景

2、了解 TiDB 的架构设计和起发展过程

3、了解关键特性的内部原理


案例背景:


传统以DB为中心的架构是系统核心瓶颈点。这类架构带来几类问题:


1、带来超高的治理成本

人人都是SQL大师,出了问题就是查改各种慢SQL,耗时耗力,没有终点;不断升级硬件缓解问题。


2、硬件高昂

不断升级硬件来缓解问题,动辄几千万的很常见。


3、管理成本高

很难建立有效的管理标准,并让一线好执行,结果好评判。


4、性能及稳定性的确定性差

计算的不确定性,导致计算能力超过其技术边界, 缺乏对一些新的计算技术的合理搭配。


听众收益:


1、直接可以把介绍的方案应用到自己公司

2、知道如何把控使用数据库的边界

3、了解到怎么组合各种计算技术达成性能稳定性目标,并省下大量成本


社区粉丝福利来啦!即刻起扫描下方图片二维码,即可获得往届GIAC大会PPT资源包一份,数量有限,先到先得。





本文分享自微信公众号 - 金融级分布式架构(Antfin_SOFA)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中

作者的其它热门文章

打赏
0
0 收藏
分享
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部