文档章节

ceph mon自行shutdown故障记录

xueyi28
 xueyi28
发布于 2016/06/27 15:24
字数 277
阅读 215
收藏 0

###日志详情

2016-06-26 19:16:51.237738 7fcc4ea8f700  5 mon.c207@1(peon).osd e10469 send_incremental [10469..10469] to osd.8 192.168.0.207:6836/9153
2016-06-26 19:16:55.527467 7fcc4f290700  0 mon.c207@1(peon).data_health(292) update_stats avail 5% total 243 GB, used 216 GB, avail 14943 MB
2016-06-26 19:16:55.527763 7fcc4f290700 -1 mon.c207@1(peon).data_health(292) reached critical levels of available space on local monitor storage -- shutdown!
2016-06-26 19:16:55.527769 7fcc4f290700  0 ** Shutdown via Data Health Service **
2016-06-26 19:16:55.527812 7fcc4ce88700 -1 mon.c207@1(peon) e5 *** Got Signal Interrupt ***
2016-06-26 19:16:55.527831 7fcc4ce88700  1 mon.c207@1(peon) e5 shutdown
2016-06-26 19:16:55.527932 7fcc4ce88700  0 quorum service shutdown
2016-06-26 19:16:55.527937 7fcc4ce88700  0 mon.c207@1(shutdown).health(292) HealthMonitor::service_shutdown 1 services
2016-06-26 19:16:55.527952 7fcc4ce88700  0 quorum service shutdown

主要在这个“reached critical levels of available space on local monitor storage”,如果mon使用的ceph数据目录所在的分区(/var/lib/ceph)硬盘使用率到达警戒值,它就会认为自己已经不存在运行所需的条件了,自己就把自己shutdown了,遇到这个错误,如果不降低磁盘的使用率是无法启动ceph mon的,各位可以视自己的实际情况清理数据。

© 著作权归作者所有

下一篇: ceph osd full故障
xueyi28
粉丝 8
博文 111
码字总数 38442
作品 0
南宁
私信 提问
一个关于ceph的可用空间测试

一、环境 节点概述 mon : ceph-node01 ceph-node02 ceph-node03 osd :ceph-node01 ceph-node02 ceph-node03 mds : ceph-node01 ceph-node02 操作系统:Ubuntu 14.10 每个osd主机有一个OSD,......

DavinciRes
2015/01/04
1K
2
Ceph 9.0.3 发布,分布式文件系统

Ceph 9.0.3 发布,此版本最直观的改进是内部改进(用户不可见):OSD 的 ObjectStore 接口改进。同时还有大量关于 RGW,RBD 和其他 CephFS scrub/repair 方面的改进和修复。 更新 The return...

oschina
2015/08/25
1K
1
Ceph monitor故障恢复探讨

1 问题 一般来说,在实际运行中,ceph monitor的个数是2n+1(n>=0)个,在线上至少3个,只要正常的节点数>=n+1,ceph的paxos算法能保证系统的正常运行。所以,对于3个节点,同时只能挂掉一个。...

Yason_Luo
2014/08/28
0
0
Ceph v0.93 发布,分布式文件系统

Ceph v0.93 发布,此版本是开发版本,现已提供下载:https://github.com/ceph/ceph/archive/v0.93.zip。 Ceph v0.93 是 Hammer 第一个 RC 版本,包括最终版本的所有新特性,建议各位在非生产...

oschina
2015/02/28
1K
4
“网红架构师”解决你的Ceph 运维难题

欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由Tstack发表于云+社区专栏 本文为长篇连续剧,将分多个篇幅发表,主要介绍了从动手部署环境到后期运营故障处理过程中常见的...

腾讯云加社区
2018/10/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

NIO基于长度域的报文在Netty下的解码

1, 先复习一下粘包/拆包 1.1, 粘包/拆包的含义 TCP是个“流”协议, 并不了解上层业务数据的具体含义, 它会根据TCP缓冲区的实际情况进行包的划分,所以在业务上认为,一个完整的包可能会被TCP...

老菜鸟0217
今天
8
0
从零开始搭建spring-cloud(2) ----ribbon

在微服务架构中,业务都会被拆分成一个独立的服务,服务与服务的通讯是基于http restful的。Spring cloud有两种服务调用方式,一种是ribbon+restTemplate,另一种是feign。 其实我们已经在上...

Vincent-Duan
今天
17
0
get和post的区别?

doGet:路径传参。效率高,安全性差(get的传送数据量有限制,不能大于2Kb) doPOST:实体传参。效率低,安全性好 建议: 1、get方式的安全性较Post方式要差些,包含机密信息的话,建议用Pos...

花无谢
昨天
4
0
当谈论迭代器时,我谈些什么?

当谈论迭代器时,我谈些什么? 花下猫语:之前说过,我对于编程语言跟其它学科的融合非常感兴趣,但我还说漏了一点,就是我对于 Python 跟其它编程语言的对比学习,也很感兴趣。所以,我一直...

豌豆花下猫
昨天
14
0
10天学Python直接做项目,我做了这5件事

初学者如何尽快上手python? 市面上关于如何学python的资料很多,但是讲的都太复杂。 我就是很简单的几句话,从小白到开发工程师,我只做了五件事。 我觉得任何商业计划书如果不能用几句话讲...

Python派森
昨天
7
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部