加载中
高可用DevHa实践,告诉你生产环境0性能故障是如何做到的!

导读:近日,数列科技 CTO 陆学慧参加 ArchSummit 全球架构师峰会,并进行了题为《0 性能故障是如何做到的:高可用性能领域的 DevHA 实践》的主题演讲,详细介绍了 0 性能故障的实践经验及对...

故障复盘后的告警如何加出效果?浙江移动等老司机总结了 6 条注意事项

一分钟精华速览 某企业内部故障统计数据显示 85%的异常是靠用户上报发现而非监控发现。针对一个故障场景增加一个告警,往往需要增加数百上千个监控项,这样加下去,真的能提升业务异常的监控...

08/16 20:56
16
10年稳定性保障经验总结,故障复盘要回答哪三大关键问题?|TakinTalks大咖分享

#一分钟精华速览 # 怎么样做好故障复盘?是否只要把事故要定责到人就能解决问题? 这是很多企业/团队都要面对的问题,有着超10年系统稳定性保障经验的李道兵老师给我们分享了他的观点: 故障...

08/01 13:55
1.9K
B站713故障后的多活容灾建设|TakinTalks大咖分享

作者介绍——B站在线SRE负责人-武安闯 「TakinTalks」稳定性技术交流平台特聘讲师,2016年加入B站,深度参与B站微服务拆分、云原生改造、高可用建设、SRE转型和稳定性 体系落地等项目 ,如O...

「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?

活动时间: 2022年7月16日,14:00-17:00 活动地点:线上直播(infoQ视频号线上直播、B站直播间) 进群方式:扫码添加小树,回复「沙龙」进群 故障专题 “程序员不能被同一原因的故障坑两次”...

07/13 15:33
66
开课报名|「Takin开源特训营」第一期来啦!手把手教你搞定全链路压测!

618又来了,今年的年中大考,你是不是又遇到了稳定性问题? 每年这个时候,总有企业因为大促激增的流量导致系统稳定性出现问题,数十倍的流量涌入系统,总有一些企业因为没有做好事前筹备,最...

06/15 11:28
66
畅聊安全生产,对话B站、唯品会一线专家!|TakinTalks大咖对谈

“安全生产”是业界新兴起的一种概念,来源于传统行业,加强安全生产就是为了防止和减少生产安全事故 ,保障人民群众生命和财产安全,促进经济社会持续健康发展。 随着互联网发展,数字经济在...

05/30 11:27
398
B站S11破亿直播在线稳定性保障秘籍——TakinTalks演讲实录

《英雄联盟》S11全球总决赛·决赛中国战队夺冠,赛事直播盛况空前,观赛人数破亿。B站作为英雄联盟2021全球总决赛直播独家版权方不仅在整个比赛过程中保证了直播整体总体运行的平稳,还抗住了...

05/18 16:41
6.5K
受信通院之邀出席全球信息系统稳定性峰会,数列技术实力再获认可

4月27日,中国信通院主办的首届“全球信息系统稳定性峰会”在北京隆重召开,数列科技作为《信息系统稳定性保障能力建设指南》的主要参编单位受邀出席,并发表了主题演讲。与中国工程院院士廖...

04/28 18:29
25
信通院牵头数列科技参与主编的《信息系统稳定性保障能力建设指南》正式发布

中国信息通信研究院分布式系统稳定性实验室正式发布了《信息系统稳定性保障能力建设指南》(下称《指南》)。数列科技应邀作为主要编写单位,深度参与了《指南》的编写制定;同时,数列提供稳定...

3 步排查,3 步优化,探针性能损耗直降 44%

应用接探针除了安全问题,最担心的就是占用系统性能影响业务正常运转,今天分享一个实际案例告诉大家如何来降低探针的性能损耗。 下表为某用户的2条核心链路在200并发压测下的性能数据对比,...

低版本skywalking与LinkAgent不兼容怎么办?记一次详细的解决过程

我们在github上收到社区用户的问题反馈: 用户原先应用已经接入skywalking,需要再接入数列的LinkAgent时启动会抛java.lang.UnsupportedOperationException,导致应用启动失败。 也就是说在不...

03/18 18:25
1.8K
被动防御→积极防御,系统稳定性保障思路启发

随着数据化和信息化浪潮的深入,系统的架构在不断地演变,实现了从“单线程”到“多线程、多组件”再到“分布式、微服务”的一个跨越。目前国内外中大型企业基本都采用的是分布式系统架构,复...

03/18 18:15
1.3K
低版本skywalking与LinkAgent不兼容怎么办?记一次详细的解决过程

我们在github上收到社区用户的问题反馈: 用户原先应用已经接入skywalking,需要再接入数列的LinkAgent时启动会抛java.lang.UnsupportedOperationException,导致应用启动失败。 也就是说在不...

03/18 18:09
361
轻松应对双11,大促保障利器Takin助力中通完成系统维稳任务

中通快递作为国内知名综合物流服务企业,已连续5年稳坐行业市场份额榜首。受双11、618等大促活动影响,井喷式的业务流量对中通的系统稳定性提出了更高的要求,过去的压测方案已经无法满足业务...

让全链路压测变得更简单!Takin2.0重磅来袭!

自Takin社区版1.0发布两个多月以来,有很多测试同学陆续在各自的工作中运用了起来,其中包括金融、电商、物流、出行服务等行业。这个过程中我们收到了很多同学的反馈建议,同时也了解到很多同...

关于 takin-data,你想知道的都在这里(二)trace 日志篇

相信大家在使用takin的过程中都见到过压测过程中实时展示的请求流量明细和请求详情了吧,像这样: 还有这样: 这样的请求流量明细和调用链详情是怎么实现的呢,今天就带大家探究下。 在前面的启动...

关于takin-data,你想知道的都在这里(一)启动命令篇

通过docker部署体验takin的小伙伴都应该知道,在安装部署手册(https://docs.shulie.io/docs/opensource/opensource-1d40ib39m90bu) 中有提到:在启动surge-deploy任务前,需要将启动命令中...

2021/09/06 17:44
25
短短 29 天,应对高峰 100W+ 访问,看浙大如何交出满分答卷

疫情期间“停课不停教,停课不停学”,线上开课第一天,浙江大学网上开课平台访问量即突破100 万次,访客数3万余人,最高峰达 1.1万人同时在线,发起课程直播2000余场,然而系统却未发生一次...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部