文档章节

阿里巴巴发布智能运维故障管理AI+生态计划

阿里云云栖社区
 阿里云云栖社区
发布于 06/14 17:54
字数 1467
阅读 41
收藏 0

摘要: 为响应马老师“家国情怀,世界担当”的号召,开放“AI+”生态计划,将让集团内部服务过程中积累下的技术与经验更好地回馈社会,任何企业或合作伙伴均可以简单方便的接入阿里巴巴智能故障管理平台,通过对接入数据的训练学习实时提供异常检测、关联分析、根因定位的能力,使原有的IT管理模型瞬间实现低成本的智能化升级,为IT同行们更便捷的提升工作效率、降低人力成本尽一份绵薄之力。

       6月7日,2018云栖大会·上海峰会在上海世博中心举行。本次大会以“驱动数字中国”为主题,聚焦人工智能、金融、零售、IoT等行业,聚焦产业生态新发展,展现产业链上下游新应用,推动云端新融合,降低行业企业信息化成本,助力上海经济新发展。大会全面展现数字化魅力,如何利用“数字”带动企业转型、促进业态发展、创造产业新动能,激发数字经济新引擎。

  对于当前IT运维圈子里最火爆的AIOps概念,本次大会也设立了主题分会场,共同探讨人工智能在IT运维领域的应用与实践。

 

开放“AI+”生态计划,回馈社会

 

  阿里巴巴全球运行指挥中心(GOC)掌门人沈乘黄首先分享了“智能运维在阿里巴巴线上故障管理领域的应用经验”。沈乘黄站在集团业务连续性保障的角度,讲述了GOC团队如何通过机器学习应对每秒数千万数据的处理,把握阿里每一项业务的运行状况,实现对近百个技术团队、数万名研发人员的应急信息实时互联,让一切线上问题无所遁形,让所有阿里技术团队令行禁止。

  同时,沈乘黄正式宣布,为响应马老师“家国情怀,世界担当”的号召,开放“AI+”生态计划,将让集团内部服务过程中积累下的技术与经验更好地回馈社会,任何企业或合作伙伴均可以简单方便的接入阿里巴巴智能故障管理平台,通过对接入数据的训练学习实时提供异常检测、关联分析、根因定位的能力,使原有的IT管理模型瞬间实现低成本的智能化升级,为IT同行们更便捷的提升工作效率、降低人力成本尽一份绵薄之力。

 

智能算法,为业务稳定连续运行保驾护航

 

阿里巴巴高级技术专家王肇刚由浅入深分享了“全球运行指挥中心(GOC)团队提供的智能算法模块的技术实现与应用心得”,讲述了如何在复杂的业务场景下迅速发现异常事件,并从千万个指标中寻找关联事件,最终确定异常事件的根源,并通过应急、通知、恢复、复盘、演练等一系列动作完成故障管理的闭环,最终确保业务稳定连续的运行。

单指标多维下钻分析

当业务指标总量异常出现时,准确地智能定位到出现异常的分量或分量组合。

 

多指标相关性分析

•       当指标异常时,动态发现有相似下跌形态的相关指标,为原因定位提供重要线索。
•       通过离线分析,发现业务报警之间的关联规则,当单业务异常时能够对其它业务进行提前预警。

可疑应用/事件分析

•       自动基于运维数据仓库进行相关应用/事件检索,锁定怀疑范围。

•       自动根据指标异常和事件相关性进行推荐排序,筛掉无关事件。

开放合作,为用户带来更多价值

      大会所在的世博中心曾经是上海世博会的会议中心,秉承着平等开放、合作共赢的理念向全世界展示了中国的新面貌,本次云栖大会也正传承了开放合作的理念,首批“AI+”生态合作伙伴涵盖了网络分析、应用交付、云计算服务、日志分析、业务运维等不同领域。

其中成都科来软件有限公司技术副总裁龙成、深信服科技股份有限公司研发部总经理邱亮、上海驻云信息科技有限公司执行总监李俊涛、北京优特捷信息技术有限公司(日志易)技术总监饶琛琳、云智慧(北京)科技有限公司高级技术顾问杨路分别在其各自领域就智能运维的落地实践,以及与阿里巴巴智能故障管理平台结合后为客户带来的价值提升做了分享,让企业在智能化升级的过程中有更多的方案选择。

      分会场上技术专家的精彩演讲,得到了广泛好评,智能运维等词成为会场热议话题。不少参加会议的专家和观众表示,演讲很有收获,从技术和应用的层面对AI在运维领域的应用与实践有了更多更深的了解,也希望未来能够了解更多智能运维领域的技术和发展。 

原文链接

本文为云栖社区原创内容,未经允许不得转载。

© 著作权归作者所有

共有 人打赏支持
阿里云云栖社区
粉丝 66
博文 753
码字总数 1644928
作品 0
朝阳
私信 提问
AIOps智能监控在阿里巴巴故障管理工作中的成功实践

摘要:在自动化运维还不普及的时候,运维人员更多的运用手动的方式完成运维工作,这种方式耗时长,效率低。由此,如何合理发挥人工智能技术辅助运维人员进行故障管理工作逐步成为了业界关注的...

止水如心
06/26
0
0
阿里巴巴研究员刘国华:阿里巴巴智能运维体系建设

导语:在2018年开放数据中心峰会(Open Data Center Summit 2018)开幕式上阿里巴巴研究员刘国华发表了《阿里巴巴智能运维体系建设》的主题演讲。演讲中,刘国华介绍了智能化给阿里巴巴未来基...

云效鼓励师
10/19
0
0
科技变革,未来已来,第六届全球软件案例研究峰会成功落幕

会上,百度云、美团、小米等众多企业的代表分享了诸多精彩案例。 2017年,软件研发行业再一次迎来大跨步前进,深度学习、人工智能、大数据等领域的发展带来道的革新,DevOps、微服务等技术的...

行者武松
04/03
0
0
阿里云副总裁孙磊:Game Master,赋予游戏新智慧

8月3日,2018阿里巴巴游戏生态晚会在上海浦东隆重召开,本次大会由阿里云、阿里游戏、阿里九游、英特尔等共同举办,聚焦游戏产业生态,集中展示覆盖全产业链的阿里巴巴游戏生态体系如何赋能游...

耿纯
08/08
0
0
【资料合集】2018云栖大会上半年深圳、南京、武汉、上海峰会全记录

2018年,云栖大会城市峰会已陆续在深圳、南京、武汉、上海四座城市举办。作为行业的先行军和领导者,云栖大会继续为大家带来高可用高可靠的前沿技术分享,应诸多云栖粉丝的恳求,方便大家回顾...

云迹九州
06/29
0
0

没有更多内容

加载失败,请刷新页面

加载更多

微服务分布式事务实现

https://www.processon.com/view/link/5b2144d7e4b001a14d3d2d30

WALK_MAN
今天
2
0
《大漠烟尘》读书笔记及读后感文章3700字

《大漠烟尘》读书笔记及读后感文章3700字: 在这个浮躁的社会里,你有多久没有好好读完一本书了? 我们总觉得自己和别人不一样,所以当看到别人身上的问题时,很少有“反求诸己”,反思自己。...

原创小博客
今天
3
0
大数据教程(9.5)用MR实现sql中的jion逻辑

上一篇博客讲解了使用jar -jar的方式来运行提交MR程序,以及通过修改YarnRunner的源码来实现MR的windows开发环境提交到集群的方式。本篇博主将分享sql中常见的join操作。 一、需求 订单数据表...

em_aaron
今天
3
0
十万个为什么之什么是resultful规范

起源 越来越多的人开始意识到,网站即软件,而且是一种新型的软件。这种"互联网软件"采用客户端/服务器模式,建立在分布式体系上,通过互联网通信,具有高延时(high latency)、高并发等特点...

尾生
今天
3
0
Terraform配置文件(Terraform configuration)

Terraform配置文件 翻译自Terraform Configuration Terraform用文本文件来描述设备、设置变量。这些文件被称为Terraform配置文件,以.tf结尾。这一部分将讲述Terraform配置文件的加载与格式。...

buddie
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部