统一运维平台的思考

原创
04/19 13:31
阅读数 91

云原生的赛道拉开后,大公司都忙着不断引领潮流,小公司因为公有云的普及也可以紧跟潮流,反观当前最难受的是那些中型公司,不断思考云原生时代的转型,由于历史的包袱以及公司已经稳定的业务,通常都要开始进行内部统一平台的建设,今天首先简单给大家分享下,整个系统会做成一个系列分享给大家

要解决的问题

由于工作职责的分工不同,在中型互联网公司中,通常每个部门就只负责一块单独的功能,因此相关的平台的建设通常也都是由组内的运维或者研发搞定,这种在早期会非常快,首先因为熟悉业务,其次都是在一个组内所以平台开发起来,从功能角度完成度会比较高,但是会存在下面几个问题。

数据孤岛

由于每个系统都是独立建设数据就只存在自己的系统里面,研发想知道自己究竟用了那些数据,做了哪些配置都找不到一个地方,有人说这事CMDB能解,前提是有一个类似蓝鲸或者easyops的CMDB,或者一个大家一起来玩k8s吧。其次由于数据相互之间没有任何关联,当在需要些关联关系分析的时候就扒瞎了。

自助服务困难

很多系统通常都有不愿意直接开放给用户用,美其名曰是有安全风险,需要保障稳定性。大多数的时候,我都在想一个问题,为什么一个操作可以给运维,而不能给研发?如果有明确的风险点,应该从系统内部解决,如果不能明确,运维和研发操作的本质区别是啥?

操作手册多

研发究竟要看多少操作手册、问多少人才能搞定一个操作?不同的平台操作手册不同,流程不同,需要注意的都不通,用户的操作其实通常并不多,为什么没有一个通用的平台?

权限系统

系统通常都会有相关的权限控制,但是随着公司平台的增多,通常每个平台都会搞一套自己的权限,最终就导致用户苦逼,比如来一个新人,可能需要到各个平台来进行各种权限的开通,才能让一个新人后续能正常的开发

这些问题其实有时候看是问题,有时候看又不是问题,本质上是人的角度与职责的不同,相对于上一代运维平台的开发,下一代基于云和云原生运维平台的建设,应以新的思路来进行建设,这里给大家分享爱因斯坦说过的一句话:

Problems cannot be solved at the same level of awareness that created them

但是也给大家提个醒,每当我们做一个平台的时候都要不断的思考要解决那些问题,最终的结果就是两个:1)提出的问题被解决 2) 提出问题的人被解决,希望大家都是第一种

系统架构

为了解决之前提到的问题,运维控制台主要是通过两个核心模块:应用管理、资源管理

资源管理:成本分摊、基础资源管理

资源管理主要是通过服务目录对公司的各种基础服务进行整合,用户通过服务目录选择对应的服务,然后创建服务。由运维控制台来对接各种基础平台实现各种资源的交付,在过程中运维控制台会沉淀相关的元数据和交付流程数据,实现流程透明化,数据统一存储

通过沉淀的数据,运维控制台采用了类似图的模型,通过对沉淀的元数据相互建立关系,从而实现各种资源的关联,为计费系统提供相关的元数据。

应用运维:全生命周期管理、权限管理

应用运维模块首先提供应用全生命周期管理的相关功能,然后通过整合上面的资源管理,实现用户自助化,然后以应用为中心为用户提供资源的统一的视图,并且建立以应用为中心的权限管理体系

用户功能

用户功能汇总:https://www.processon.com/view/link/607c4cd87d9c08283dd189d0

云原生学习笔记地址:  https://www.yuque.com/baxiaoshi/tyado3微信号:baxiaoshi2020 公共号: 图解源码


本文分享自微信公众号 - 图解源码(sreguide)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部