文档章节

Servicehot和你说说运维自动化的那些事儿

ABBYY
 ABBYY
发布于 2017/09/08 10:08
字数 2034
阅读 11
收藏 0
点赞 0
评论 0

运维管理兜兜转转十几余载,大家的运维管理再也不是小米加步枪、人工费力拉线扛服务器的传统时代,如你所知,这些年大家张口闭口谈的都是运维自动化如何如何。

  运维自动化到底是个啥?

  据度娘之意,IT运维自动化是将日常IT智能运维中大量的重复性工作,小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度等,由过去的手工执行转为自动化操作,从而减少乃至消除运维中的延迟,实现"零延时"的IT运维。

  其本质是运维方式的转变,由手动逐渐演变为自动化操作!那运维自动化应该包含哪几个层面?鉴于IT运维五个维度”效率、稳定、安全、体验、成本”范畴,运维自动化统筹起来就有监控自动化、服务流程自动化、运维操作自动化......

  IT监控自动化

  监控自动化是运维自动化的起点之一,利用监控自动化平台对各类IT资源(包括服务器、数据库、中间件、存储备份、网络、安全、机房、业务应用、操作系统、虚拟化等)进行实时监控,再做故障根源告警归并处理,以解决特殊情况下告警泛滥的问题,例如机房断网造成的批量服务器报警。

  当然,监控自动化的范畴很广,除了监控告警响应,系统各个服务如Nginx、Java、PHP、DB或网络等的性能优化、资产关系的梳理以及业务系统的实时健康评估监测也是应该包含在里面。

  服务流程自动化

  监控自动化发现了问题就应该接入相应的流程进行处理,这时候故障事件自动触发问题处理跟踪流程,并在自动化工单式流程的指引下通知到相关责任人,并利用知识库自动化完成整个故障处理协调过程。

  运维操作自动化

  这个层面的自动化运维工具,主要是把运维一系列的手工执行繁琐的工作,按照日常正确的维护流程分步编写成脚本,然后由自动化运维工具按流程编排成作业自动化执行。

  简单来说,就是把多个Shell、python、PowerShell、Bat等脚本串在一起执行实现某个特定的操作目的,以此来替代一些日常需要批量或者大量重复性的操作,比如变更、部署、配置下发等操作!

  以前,传统的运维方式是由监控系统监控,根据阈值设置产生告警,走工单方式人工处理。现在,使用自动化运维平台,可以让产生的告警和知识关联,自动化处理故障。也就是说,IT运维自动化工具是监控自动化和流程自动化工具的完善和补充,三者结合相得益彰!

  总体来说,运维自动化不是写写脚本,再用开源软件东拼西凑就完了,这只能叫辅助运维,不叫自动化。据我所知,真正的自动化应该是让运维平台工具帮你’监测——发现——处理——解决问题”,集”自我修复、自我维护”为一体,各模块之间尽量低耦合、可扩展、可插拔,最终实现运维智能化;也应该是真正能帮企业降低IT运成本,使运维管理可视化、可测量、可对比,进而真正将运维人员从繁琐的、例行、容易发生人为事故的工作中脱离出来,做更有价值的运维工作。

  运维自动化怎么做?

  很多运维人员在筹建IT运维自动化架构体系时,妄图一口吃个大胖子,谋求一个完整的系统来自动化完成所有的运维工作,殊不知自动化是一个循序渐进持续发展的过程。我觉得在思考如何做运维自动化之前应该认识到几个根本的原则问题:

  标准必备

  正所谓无规矩不成方圆,实施自动化前提需要标准规范与流程化。这包括资源标准化、OS的基础配置标准化、基础软件(如Tomcat、JVM)配置标准化、应用配置标准化、流程规范标准化......比如,如Ngnix/JAVA/PHP/MySQL这些常见服务的应用初始化流程、部署更新流程等,可以提前固化下来,做到了标准化,消除了各种差异,才能为后续的自动化开发铺平前进的道路。

  与此同时,随着ISO20000、ITIL v3.0的持续推广,它们已成为实际的某种标准,尤其是ISO20000的认证要求,也是企业的普遍需求,而ITIL v3.0包含了对IT运维从战略、设计到转换、运营、改进的服务全生命周期的管理,也为企业的服务流程管理自动化提供了更多思路!

  实用为先

  大家常说,“公司的系统架构不是设计,而是演变而来的。”一般而言,企业要做运维自动化都不是一蹴而就,也不太可能一次性建好,都是分阶段来做以解决自身实际问题:首先应该明确自身处于“手动支撑 —— 线上标准规范化——运维工具化——平台自动化”的哪个阶段,然后先找准现阶段的痛点,对症下药。

  说到实用,不得不提到——CMDB。

  关于“CMDB是不是运维自动化的基石“,不少运维还在疑惑,到底要不要建立CMDB呢? CMDB即配置管理数据库,一般用于统一管理IT数据、服务器数据资产等。它不仅是硬件和资源的信息记录,更重要是要建立起应用与资源之间的对应关系,并以此为基础,配套着应用配置管理、监控、发布、稳定性等系统的建设,才能最终形成体系化的运维平台,否则只是碎片化的运维模式。

  当然,这里只是让CMDB只提供最基础的资源信息和应用资源的关联关系,不期望把基础的CMDB做得过重,不然后期会不堪重负!

  安全为重

  运维安全是企业安全保障的基石,不同于Web安全、移动安全、业务安全,随着自动化运维管理体系的不断融合与统一,运维安全环节任何一个代码、一次部署出现问题往往会比较严重,很多时候说”牵一发而动全身“都不为过。

  此外,运维自动化平台关联的资源越来越多且复杂,甚至都涉及到了root权限,为广大黑客朋友创造更多空间,所以加强自身安全防御势在必行。最基本的是加强权限和基线控制,是否针对运维自动化平台的服务器账号做了特殊限制?是否做了超限检查?是否做了关键操作的双保险?是否做了作业执行脚本、数据传输的加密控制?通通都得考虑,而堡垒机、安全审计、防火墙控制等措施更是不在话下了。

  运维自动化安全建设牵扯面广,这里就不一一赘述了。还得提醒一点,在运维自动化操作层面,如何缓解自动化操作条件的变化而引发的巨大运维压力,也应该认真考虑。

      了解更多关于ITSM系统以及工具方面的内容,可以关注一下我们ServiceHot 哦~

© 著作权归作者所有

共有 人打赏支持
ABBYY
粉丝 5
博文 347
码字总数 188111
作品 0
南京
顺丰全栈资源下的自动化运维灵魂

顺丰全栈资源下的自动化运维灵魂 运维派2017-12-211 阅读 自动化运维 前言: 首先,我们先发散一下思维,后收敛。天下武功为快不破,互联网时代,让大家可以充分的分享信息,运维大会这类 […...

运维派 ⋅ 2017/12/21 ⋅ 0

有赞数据库自动化运维实践之路

有赞数据库自动化运维实践之路 运维派2017-12-210 阅读 数据库自动化运维 一、前言 有赞作为”新零售”的软件服务供应商,随着业务的不断发展,从第一批几十家商户到现在300万商家,涉及零 ...

运维派 ⋅ 2017/12/21 ⋅ 0

如何有效提升团队的微服务落地能力?

如何有效提升团队的微服务落地能力? 运维派2018-01-041 阅读 自动化运维微服务 微服务体系的发展并不是一蹴而就的,经过了2014年前后的低潮期,微服务概念顶层的泡沫逐渐褪去,那些真正能够...

运维派 ⋅ 01/04 ⋅ 0

百亿访问量的监控平台如何炼成?

百亿访问量的监控平台如何炼成? 运维派2017-12-262 阅读 监控 前言: 很开心能够跟大家分享 WiFi 万能钥匙在监控领域做的一些事情,本文分享的主题是《百万访问量的监控平台 […] 点赞 监控...

运维派 ⋅ 2017/12/26 ⋅ 0

当在mysql5.7上发现这个bug,小心脏不好受了

当在mysql5.7上发现这个bug,小心脏不好受了 运维派2018-01-155 阅读 索引BUGmysql 近期连续很长一段时间忙成狗, 没有写些文章来跟大家分享。现在接近晚上12点,但还是准备把这个bug简单分享...

运维派 ⋅ 01/15 ⋅ 0

浅谈运维自动化的那些事儿

前言 运维管理兜兜转转十几余载,大家的运维管理再也不是小米加×××、人工费力拉线扛服务器的传统时代,如你所知,这些年大家张口闭口谈的都是运维自动化如何如何。一千个读者就有一千个哈...

勤智运维 ⋅ 2017/12/05 ⋅ 0

我的友情链接

51CTO博客开发 mage-郭茂秋 mage-王胜辉 mage-金广平 马哥教育Linux mage-白鹏 “企鹅”那点事儿 老男孩linux运维 吴光科-专注自动化运维 煮酒品茶 抚琴煮酒 技术成就梦想 单身贵族 eliv-hac...

Linux顺子 ⋅ 2017/11/22 ⋅ 0

运维的日常:如果回到18岁,你还会选择运维行业么?

运维的日常:如果回到18岁,你还会选择运维行业么? 运维派2017-12-311 阅读 运维选择 马上就是2018年了 朋友圈突然被18岁刷屏 都说IT行业是吃青春饭 如果真的回到18岁,你还会选择运维或者I...

运维派 ⋅ 2017/12/31 ⋅ 0

2018,新年快乐!

2018,新年快乐! 运维派2018-01-013 阅读 时间过得真快,2018年到来了。 这一年,我结束了上次创业,关闭了公司,经过几个月的总结反思后,又开始了第二段 […] 点赞 作者:运维派 IT运维那...

运维派 ⋅ 01/01 ⋅ 0

美团Linux运维工程师面试真题曝光

美团Linux运维工程师面试真题曝光 运维派2018-01-031 阅读 Linux 作为Linux运维工程师,进入大公司是开启职业新起点的关键,今天马哥linux运维及云计算智囊团的小伙伴特别分 […] 点赞 Linu...

运维派 ⋅ 01/03 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

JDK1.6和JDK1.7中,Collections.sort的区别,

背景 最近,项目正在集成测试阶段,项目在服务器上运行了一段时间,点击表格的列进行排序的时候,有的列排序正常,有的列在排序的时候,在后台会抛出如下异常,查询到不到数据,而且在另外一...

tsmyk0715 ⋅ 29分钟前 ⋅ 0

spring RESTful

spring RESTful官方文档:http://spring.io/guides/gs/rest-service/ 1. 可以这么去理解RESTful:其实就是web对外提供的一种基于URL、URI的资源供给服务。不是一个原理性知识点。是一个方法论...

BobwithB ⋅ 31分钟前 ⋅ 0

C++ 中命名空间的 5 个常见用法

相信小伙伴们对C++已经非常熟悉,但是对命名空间经常使用到的地方还不是很明白,这篇文章就针对命名空间这一块做了一个叙述。 命名空间在1995年被引入到 c++ 标准中,通常是这样定义的: 命名...

柳猫 ⋅ 33分钟前 ⋅ 0

@Conditional派生注解

@Conditional派生注解(Spring注解版原生的@Conditional作用) 作用:必须是@Conditional指定的条件成立,才给容器中添加组件,配置配里面的所有内容才生效; @Conditional扩展注解 作用(判...

小致dad ⋅ 34分钟前 ⋅ 0

适配器模式

适配器模式 对象适配器 通过私有属性来实现的类适配器 通过继承来实现的接口适配器 通过继承一个默认实现的类实现的

Cobbage ⋅ 38分钟前 ⋅ 0

Java 限流策略

概要 在大数据量高并发访问时,经常会出现服务或接口面对暴涨的请求而不可用的情况,甚至引发连锁反映导致整个系统崩溃。此时你需要使用的技术手段之一就是限流,当请求达到一定的并发数或速...

轨迹_ ⋅ 42分钟前 ⋅ 0

GridView和子View之间的间隙

默认的情况下GridView和子View之间会有一个间隙,原因是GridView为了在子View被选中时在子View周围显示一个框。去掉的办法如下: android:listSelector="#0000" 或 setSelector(new ColorDra...

国仔饼 ⋅ 45分钟前 ⋅ 0

idea插件开发

1 刷新页面要使用多线程 2 调试要使用restart bug 不要去关闭调试的idea 否则再次启动会卡住

林伟琨 ⋅ 45分钟前 ⋅ 0

Java 内存模型

物理机并发处理方案 绝大多数计算任务,并不是单纯依赖 cpu 的计算完成,不可避免需要与内存交互,获取数据。内存要拿到数据,需要和硬盘发生 I/O 操作。计算机存储设备与 cpu 之间的处理速度...

长安一梦 ⋅ 52分钟前 ⋅ 0

思路分析 如何通过反射 给 bean entity 对象 的List 集合属性赋值?

其实 这块 大家 去 看 springmvc 源码 肯定可以找到实现办法。 因为 spirngmvc 的方法 是可以 为 对象 参数里面的 list 属性赋值的。 我也没有看 具体的 mvc 源码实现,我这里只是 写一个 简...

之渊 ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部