文档章节

优云软件叶帅:“互联网+”时代的云数据中心运维思辨(下)

优云双态运维
 优云双态运维
发布于 2017/08/28 16:08
字数 2648
阅读 5
收藏 0

接上篇 优云软件叶帅:“互联网+”时代的云数据中心运维思辨(上)

2017中国开源产业峰会暨中国国际软件博览会分论坛,优云软件叶帅在开源云计算技术创新论坛发表了《“互联网+”时代的云数据中心运维思辨》的主题演讲,本文根据演讲内容整理而成。

无论是稳态还是敏态,大家关注的内容最终的目标并不会发生变化,最终的目标都是保证当前的数据、业务或者用户能够得到一个比较好的系统体验,是不是说随着云环境或者容器对象的引入,当前的IT对象或者IT服务就能够得到持续的比较好的体验呢?其实往往不是这样的。

随着业务系统或者整个IT架构发生一个复杂的变化,要管理的内容也变得越来越多,以前只是单纯地维护网络,维护存储,维护操作系统,维护我们的数据控制原件就可以了。那么随着虚拟化、容器应用的这样一个引入,我们发现更多的IT架构是发生瞬时变化的,很可能容器对象在服务器A下一刻就到服务器B去了,导致我们要花很大的力气去做整体业务可用性的一个盘查,这样的难度也越来越大。

那么如何能够保证用户得到比较好的一个效果,而我们的业务还能持续运行,这其实是我们要考虑的事情。广通软件提出了一个应用端到端的管理思路,这个应用端到端的管理思路跟传统的这种APM监控或者PPM监控略有不同。

传统的监控更多的还是关注工具层面,单独工具或者单一工具它所获得的信息内容,而广通软件的这个应用端到端的管理,不仅能够去捕捉到某个不满意用户的总体访问情况,哪些不满用户它的那个慢交易在什么地方,还能够对这个用户的慢交易进行过程的回溯甚至是定位到这个慢交易是在哪段代码中、哪个数据库中出现了问题,做到一个前端跟后端的关联,这个是我们认为端到端应该做的一个事情,而不是局限于应用层或者仅局限于数据层、用户体验层面的一个内容。

我们要打通从用户体验到数据到应用到底层架构的这样四层关联,那这个是我们在应用监控方面的一个内容。

接下来就提到了我们的第三个内容,有了资源管理,也有了监控管理,那么这些有没有很好的去解决当前运营的一些问题呢,它只能够保证在运维被动式响应的场景能够得到很好的一个改善,达到一个主动式的运维。那么如何能够把运维从主动式转到一种运维效能或者服务交付式运维呢,我们提出了自动化处置的一个概念。过去传统的自动化运维关注的内容是包含了像我们的巡检、合规性检查、日志分析数据迁移的一些内容,过去关注的内容更多是对于操作系统对象层面的日常巡检或日常关注的一个运维交付。那么我们在敏态环境下,在当前云环境和“互联网+”下面我们更多的通过自动化运维,要做的事情是把DevOps的一个从代码构建到代码发布,到最后持续运维、运营都纳进来。所以说我们当前所关注的敏态下的自动化运维,它更多的是从持续交付到整个系统的弹性发布,甚至是故障自愈达到这样目的。

我们把整个运维过程进行拆分,定义每个过程或者每个场景是我们整个运维生产线上的一个原子化操作,那么我们把这个原子化操作进行生产链的组合,保证它是整个木桶,没有任何短板,而且整个木桶的衔接也是没有任何问题的。那么通过编排把这些定义好的原子化操作进行场景化的示例,进行产品化示例之后,进行快速的交付,交付就可以通过监控驱动或者流程驱动或者人工驱动等诸多方式来保证自动化的这种快速的应用,这个是我们自动化的一个思路。

那么自动化应用在什么地方?其实自动化更多的是应用在一些比较大的数据中心。我们来给大家算笔账,一台服务器从系统部署到最后的监控告警大概需要30分钟,那么如果我们有一百台甚至是一千台服务器,这就会是一件很可怕的事情,我们测算了一下扩容一千台服务器大概需要2个人工作一个月的时间,这会非常消耗人力。

自动化的方式能够应用在需求调研、例行操作、响应支持、优化改善等等,我们把自动化操作通过场景的映射,把每个场景定义成不同原子化的过程,进行快速的发布,这个就是我们的自动化的一个内容。

那么我们说整个信息发展或者技术发展遵循的路线都是先通过高精尖的技术去完善工具,当完善工具之后,那么工具会形成一个打通平台的内容,当有平台之后人会参与工具之中,人会参与平台之中,实现人与工具,人与平台的对话。那么最后我们在这边简单的提一下对于运维的一个展望和对未来发展的理解,广通软件认为人工智能肯定是最后运维发展的一个终极目标,那么人工智能包含了人与机器、机器与机器,人与人之间的快速协同,我们把它称之为ChatOps,这种即时协同的方式来去做我们快速的一个交付。

我们的这种即时协作可以广泛应用在我们的环境部署、故障排查以及相关的功能交付,涵盖了监控到资源管理到整个自动化的所有运维场景,能够帮助我们的人员进行快速下达指令,能够进行一个快速执行。那么运维的即时协作,更多的是通过创建人工的工作组的方式来成立专项的PMO,在专项PMO里面我们以人为本,人员通过智能语意的方式对机器人进行语义的下达,比方说让它去扩容某个表空间,那么智能机器人就识别了这样的一个语义,它就可以去调用自动化的工具去做这个事情。

那么通过ChatOps可以想象到这样的一个人与机器的协作最终的目标是降低人员对于运维工具的过分依赖,通过命令的方式让不具备全栈运维的人员也能参与进来,只要有这个权限,只要有这个知识,那么就可以下达这个命令,由机器来帮助执行。

通过设立不同的专项组,我们成立了运维专题,那么在运维专题里面可以查看当前的配置项,甚至是把这个配置上的一个消费圈订阅到比较醒目的看板上,同时也可以去查看性能状态、监控状态,也可以去执行一些故障恢复的脚本,查看一些监控报警等等。这个其实就是我们整体的一个运维发展未来远景的规划,就是通过智能语意、智能技术来帮助我们实现面向未来智能时代的一个人员与运维的快速结合。

广通软件过去是做传统运维的,那么现在更多是帮助用户实现“数字化”与“互联网+”时代下的IT运维快速的迭代,帮助他们去稳步适应ITIL和DevOps的冲击,那这个就是本次演讲的内容,非常感谢各位.

观众提问:

老师好,现在互联网比较流行这种微服务架构,就是目前我们一些传统企业包括金融行业也是把自己的互联网部分逐渐的在微服务化,大家也知道微服务不像以前的那种通过企业总线统一去交付,而是去相应的服务引擎那一块去发现这个服务,然后就实现一个大范围网状的一个交付,对于这种架构的话我们有没有一些相应的策略或者方案。

叶帅回答:

对于互联网现在我们用的比较多的这种微服务架构,首先第一个微服务架构是通过网关的方式来实现或者通过OpenAPI的方式来去实现我们整个数据的互通,数据的交互,那么我们现在提到的运维Pass平台也是基于微服务的架构去做的这个内容,那么我们通过两方面来实现整个微服务的管理,第一个方面是通过比较基础的一个日志方面进行管理,第二个是通过端口镜像的方式去做网络报文的一个跟踪,因为它是通过OpenAPI的方式来去做整个消息的这样一个互通,所以通过报文的方式来去捕捉,来去解析整个数据传输或者整个数据交互的一个内容是更为合适的。

福利:优云软件全线saas版免费使用:www.uyun.cn

© 著作权归作者所有

共有 人打赏支持
优云双态运维
粉丝 4
博文 85
码字总数 110714
作品 0
杭州
程序员
私信 提问
“第七届中国云计算应用论坛”成功召开

2017年2月19日,由CIO时代学院、中国新一代IT产业推进联盟主办,CIO时代网承办,北达软、中国通信工业协会两化融合委员、小云优选协办的“第七届中国云计算应用论坛”在北大中关新园成功举办...

玄学酱
04/18
0
0
双态运维联盟(BOA)正式成立,DaoCloud 引领企业数字化转型

3 月 1 日,由联想、DaoCloud、新华三、华为等 12 家 IT 企业在北京正式达成协议,联合发起成立 “双态运维联盟”。中国电子工业标准技术协会、信息技术服务分会数据中心运营管理工作组(DCM...

玄学酱
04/17
0
0
云计算时代数据中心运维三大要点

在当前企业IT系统向云架构转型的时刻,运维系统再一次面临着新的挑战。所以在数据中心运维的时候,运维人员应该注意哪些问题? 在云计算时代,IT系统建设越来越成为企业发展至关重要的一环。业...

六库科技
08/23
0
0
ITSM之学习路线

传统的ITIL方法论融入社交化敏捷运维思想, 能够灵活、高效的支撑上层业务需求,具备敏捷化、社交化和自动化等特性。 优云ITSM源于广通十多年的企业级运维流程经验沉淀,融合目前互联网社交化...

heavenseahill
2017/11/08
0
0
应“云”而生--云时代的运维新理念

2016年9月9日,云和恩墨“数聚云端”新品发布会推出了满足云时代运维发展趋势和客户需求的新产品平台。云和恩墨创始人盖国强先生从行业趋势和公司发展理念谈了互联网时代对传统运维的冲击,以...

玄学酱
05/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

《阿里铁军》的读书笔记和读后感范文2600字

《阿里铁军》的读书笔记和读后感范文2600字: 在中国互联网,有一个流传很广的说法是,百度强在技术,腾讯强在产品,阿里强在运营。虽然发展到今天,已经不能再用这样简单的视角来看待这三个...

原创小博客
3分钟前
1
0
怎样实际项目中运用责任链模式

1 模式概要 1.1 简介 责任链模式为请求创建一个接收者对象链,每个接收者都包含对另一个接收者的引用,如果一个对象不能处理该请求,那么它会把请求传给下一个接收者,依此类推 责任链模式避...

小刀爱编程
18分钟前
1
0
【宇润日常疯测-004】JS 遍历数组如何快!快!快!

首先,我就是一后端全栈,对前端也只是会用罢了。闲的无聊来测测,不深究,只看表面,不喜勿喷! 遍历数组在写 JS 代码时候一定是经常用的,那么怎么遍历能达到最高效率呢,很多人一定没有测...

宇润
22分钟前
9
1
Linux系统如何定制History输出格式

Linux系统使用History命令来查看系统的运行记录,从而找出一些问题。但是History输出的数据中常常没有时间等信息。本文就来教大家Linux系统如何定制History输出格式。   具体方法如下 以r...

linuxprobe16
24分钟前
1
0
(一) pyhon 基础语法(数值 字符串 元组 列表 字典)

1、python的数据类型: 数值 字符串 列表 元组 字典; 数值类型包括; 整型(int) 长整型(long) 浮点型(float) 复数型 字符串; 可以通过type() 来查看是什么类型的; 注释:len()只支持 字符...

芬野de博客
25分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部