文档章节

阿里巴巴发布智能运维故障管理AI+生态计划

阿里云云栖社区
 阿里云云栖社区
发布于 06/14 17:54
字数 1467
阅读 27
收藏 0

摘要: 为响应马老师“家国情怀,世界担当”的号召,开放“AI+”生态计划,将让集团内部服务过程中积累下的技术与经验更好地回馈社会,任何企业或合作伙伴均可以简单方便的接入阿里巴巴智能故障管理平台,通过对接入数据的训练学习实时提供异常检测、关联分析、根因定位的能力,使原有的IT管理模型瞬间实现低成本的智能化升级,为IT同行们更便捷的提升工作效率、降低人力成本尽一份绵薄之力。

       6月7日,2018云栖大会·上海峰会在上海世博中心举行。本次大会以“驱动数字中国”为主题,聚焦人工智能、金融、零售、IoT等行业,聚焦产业生态新发展,展现产业链上下游新应用,推动云端新融合,降低行业企业信息化成本,助力上海经济新发展。大会全面展现数字化魅力,如何利用“数字”带动企业转型、促进业态发展、创造产业新动能,激发数字经济新引擎。

  对于当前IT运维圈子里最火爆的AIOps概念,本次大会也设立了主题分会场,共同探讨人工智能在IT运维领域的应用与实践。

 

开放“AI+”生态计划,回馈社会

 

  阿里巴巴全球运行指挥中心(GOC)掌门人沈乘黄首先分享了“智能运维在阿里巴巴线上故障管理领域的应用经验”。沈乘黄站在集团业务连续性保障的角度,讲述了GOC团队如何通过机器学习应对每秒数千万数据的处理,把握阿里每一项业务的运行状况,实现对近百个技术团队、数万名研发人员的应急信息实时互联,让一切线上问题无所遁形,让所有阿里技术团队令行禁止。

  同时,沈乘黄正式宣布,为响应马老师“家国情怀,世界担当”的号召,开放“AI+”生态计划,将让集团内部服务过程中积累下的技术与经验更好地回馈社会,任何企业或合作伙伴均可以简单方便的接入阿里巴巴智能故障管理平台,通过对接入数据的训练学习实时提供异常检测、关联分析、根因定位的能力,使原有的IT管理模型瞬间实现低成本的智能化升级,为IT同行们更便捷的提升工作效率、降低人力成本尽一份绵薄之力。

 

智能算法,为业务稳定连续运行保驾护航

 

阿里巴巴高级技术专家王肇刚由浅入深分享了“全球运行指挥中心(GOC)团队提供的智能算法模块的技术实现与应用心得”,讲述了如何在复杂的业务场景下迅速发现异常事件,并从千万个指标中寻找关联事件,最终确定异常事件的根源,并通过应急、通知、恢复、复盘、演练等一系列动作完成故障管理的闭环,最终确保业务稳定连续的运行。

单指标多维下钻分析

当业务指标总量异常出现时,准确地智能定位到出现异常的分量或分量组合。

 

多指标相关性分析

•       当指标异常时,动态发现有相似下跌形态的相关指标,为原因定位提供重要线索。
•       通过离线分析,发现业务报警之间的关联规则,当单业务异常时能够对其它业务进行提前预警。

可疑应用/事件分析

•       自动基于运维数据仓库进行相关应用/事件检索,锁定怀疑范围。

•       自动根据指标异常和事件相关性进行推荐排序,筛掉无关事件。

开放合作,为用户带来更多价值

      大会所在的世博中心曾经是上海世博会的会议中心,秉承着平等开放、合作共赢的理念向全世界展示了中国的新面貌,本次云栖大会也正传承了开放合作的理念,首批“AI+”生态合作伙伴涵盖了网络分析、应用交付、云计算服务、日志分析、业务运维等不同领域。

其中成都科来软件有限公司技术副总裁龙成、深信服科技股份有限公司研发部总经理邱亮、上海驻云信息科技有限公司执行总监李俊涛、北京优特捷信息技术有限公司(日志易)技术总监饶琛琳、云智慧(北京)科技有限公司高级技术顾问杨路分别在其各自领域就智能运维的落地实践,以及与阿里巴巴智能故障管理平台结合后为客户带来的价值提升做了分享,让企业在智能化升级的过程中有更多的方案选择。

      分会场上技术专家的精彩演讲,得到了广泛好评,智能运维等词成为会场热议话题。不少参加会议的专家和观众表示,演讲很有收获,从技术和应用的层面对AI在运维领域的应用与实践有了更多更深的了解,也希望未来能够了解更多智能运维领域的技术和发展。 

原文链接

本文为云栖社区原创内容,未经允许不得转载。

© 著作权归作者所有

共有 人打赏支持
阿里云云栖社区
粉丝 45
博文 604
码字总数 1320711
作品 0
朝阳
AIOps智能监控在阿里巴巴故障管理工作中的成功实践

摘要:在自动化运维还不普及的时候,运维人员更多的运用手动的方式完成运维工作,这种方式耗时长,效率低。由此,如何合理发挥人工智能技术辅助运维人员进行故障管理工作逐步成为了业界关注的...

止水如心
06/26
0
0
科技变革,未来已来,第六届全球软件案例研究峰会成功落幕

会上,百度云、美团、小米等众多企业的代表分享了诸多精彩案例。 2017年,软件研发行业再一次迎来大跨步前进,深度学习、人工智能、大数据等领域的发展带来道的革新,DevOps、微服务等技术的...

行者武松
04/03
0
0
【云栖北京】阿里首次公开展示AI布局,胡晓明秀ET大脑生态

12月20日,阿里云在云栖大会·北京峰会召开。作为2017年阿里云栖大会最后一场,会议召开前阿里官方号做足了噱头,一系列预热用“重磅”、“史无前例”等形容词吸引眼球。在本次大会上,阿里云...

技术小能手
2017/12/20
0
0
阿里云副总裁孙磊:Game Master,赋予游戏新智慧

8月3日,2018阿里巴巴游戏生态晚会在上海浦东隆重召开,本次大会由阿里云、阿里游戏、阿里九游、英特尔等共同举办,聚焦游戏产业生态,集中展示覆盖全产业链的阿里巴巴游戏生态体系如何赋能游...

耿纯
08/08
0
0
【资料合集】2018云栖大会•南京峰会回顾合集:PDF下载

云栖大会是由阿里巴巴集团主办的全球顶级科技大会,汇聚时代最强大脑,描绘新技术发展趋势和蓝图,展现云计算、大数据、人工智能等蓬勃发展的科技生态全景。六朝古都南京迎来企业与人工智能融...

yunqi_share
05/05
0
0

没有更多内容

加载失败,请刷新页面

加载更多

你为什么在Redis里读到了本应过期的数据

一个事故的故事 晚上睡的正香突然被电话吵醒,对面是开发焦急的声音:我们的程序在访问redis的时候读到了本应过期的key导致整个业务逻辑出了问题,需要马上解决。 看到这里你可能会想:这是不...

IT--小哥
今天
2
0
祝大家节日快乐,阖家幸福! centos GnuTLS 漏洞

yum update -y gnutls 修复了GnuTLS 漏洞。更新到最新 gnutls.x86_64 0:2.12.23-22.el6 版本

yizhichao
昨天
5
0
Scrapy 1.5.0之选择器

构造选择器 Scrapy选择器是通过文本(Text)或 TextResponse 对象构造的 Selector 类的实例。 它根据输入类型自动选择最佳的解析规则(XML vs HTML): >>> from scrapy.selector import Sele...

Eappo_Geng
昨天
4
0
Windows下Git多账号配置,同一电脑多个ssh-key的管理

Windows下Git多账号配置,同一电脑多个ssh-key的管理   这一篇文章是对上一篇文章《Git-TortoiseGit完整配置流程》的拓展,所以需要对上一篇文章有所了解,当然直接往下看也可以,其中也有...

morpheusWB
昨天
5
0
中秋快乐!!!

HiBlock
昨天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部