文档章节

zabbix报错排错大全

l
 linjin200
发布于 08/14 15:26
字数 1801
阅读 4
收藏 0

zabbix报错排错大全

 监控  大自然搬运工  5个月前 (03-26)  971次浏览  已收录  0个评论  扫描二维码 zabbix报错排错大全

zabbix报错

1.在启动zabbix-agent 时系统日志输出

PID file /run/zabbix/zabbix_agentd.pid not readable (yet?) after star

zabbix-agent.service never wrote its PID file. Failing

重启zabbix-agent服务依旧不能正常启动,查看/var/log/zabbix/zabbix-agentd.log 发现系统提示zabbix共享内存报错

zabbix_agentd [5922]: cannot open log: cannot create semaphore set: [28] No space left on device

后通过修改

 
  1. vim /etc/sysctl.conf
  2.  
  3. kernel.sem =500  64000   64      256
  4.  
  5. sysctl -p /etc/sysctl.conf

后便能够正常启动了。(报错原因:kernel.sem参数设置过小 ,原先系统默认设置的为 250 32000 32 128)

参数含义

上面的4个数据分别对应:SEMMSL、SEMMNS、SEMOPM、SEMMNI这四个核心参数,具体含义和配置如下。

SEMMSL :用于控制每个信号集的最大信号数量。

SEMMNS:用于控制整个 Linux 系统中信号(而不是信号集)的最大数。

SEMOPM: 内核参数用于控制每个 semop 系统调用可以执行的信号操作的数量。SE1、Zabbix报警 icmp pinger processes more than 75% busy

 
  1. [root@localhost zabbix]#  vi /etc/zabbix/zabbix_server.conf

将这个值设置成StartPingers=5,然后重启zabbix-server服务。

 

2、zabbix unreachable poller processes more than 75 busy 

unreachable poller processes 一直在处于busy的状态,那这个具体代表什么意思呢,查看官方文档zabbix internal process、unreachable poller – poller for unreachable devices 用于轮询不可到达到的设备。

可能情况:
1.通过Zabbix agent采集数据的设备处于moniting的状态但是此时机器死机或其他原因导致zabbix agent死掉server获取不到数据,此时unreachable poller就会升高。
2.通过Zabbix agent采集数据的设备处于moniting的状态但是server向agent获取数据时时间过长,经常超过server设置的timeout时间,此时unreachable poller就会升高。

3.支撑Zabbix的MySQL卡住了,Zabbix服务器的IO卡住了都有可能,Zabbix进程分配到内存不足都有可能。

一个简单的方法是增加Zabbix Server启动时初始化的进程数量,这样直接增加了轮询的负载量,从比例上来讲忙的情况就少了

 
  1. [root@localhost zabbix]#  vi /etc/zabbix/zabbix_server.conf

将这个值设置成StartPollers=500,然后重启zabbix-server服务。也可以定时重启zabbix服务。

3、Zabbix alerter processes more than 75% busy 

收到几百条zabbix告警信息:
Zabbix alerter processes more than 75% busy

可能原因:
zabbix的数据库问题
zabbix服务器的IO负载
zabbix进程分配到内存不足
网络延时或者不通

处理方法:

 
  1. [root@localhost zabbix] vim /etc/zabbix/zabbix_server.conf 
  2.  
  3. 将其默认值5修改为20:
  4.  
  5. StartPollers=500
  6.  
  7. 修改的位置
  8.  
  9. # StartDiscoverers=1
  10.  
  11. StartDiscoverers=100

4、zabbix-server服务挂了,启动后又自动停机了,并且日志中很多下面这个错误

报警提示

Zabbix value cache working in low memory mode
Less than 25% free in the configuration cache

 
  1. [root@localhost zabbix] cat /var/log/zabbix/zabbix_server.log
  2.  
  3. 6278:20180320:190117.775 using configuration file: /etc/zabbix/zabbix_server.conf
  4.  
  5. 6278:20180320:190117.807 current database version (mandatory/optional): 03020000/03020001
  6.  
  7. 6278:20180320:190117.807 required mandatory version: 03020000
  8.  
  9. 6278:20180320:190118.378 __mem_malloc: skipped 0 asked 136 skip_min 4294967295 skip_max 0
  10.  
  11. 6278:20180320:190118.378 [file:dbconfig.c,line:653] zbx_mem_malloc(): out of memory (requested 136 bytes)
  12.  
  13. 6278:20180320:190118.378 [file:dbconfig.c,line:653] zbx_mem_malloc(): please increase CacheSize configuration parameter
  14.  
  15. 6354:20180320:190128.632 Starting Zabbix Server. Zabbix 3.2.10 (revision 74337).

修改配置文件

 
  1. [root@localhost zabbix] vi /etc/zabbix/zabbix_server.conf
  2.  
  3. ### Option: CacheSize
  4.  
  5. #       Size of configuration cache, in bytes.
  6.  
  7. #       Shared memory size for storing host, item and trigger data.
  8.  
  9. #
  10.  
  11. # Mandatory: no
  12.  
  13. # Range: 128K-8G
  14.  
  15. # Default:
  16.  
  17. # CacheSize=8M
  18.  
  19. CacheSize=2048M
  20.  
  21.  
  22.  
  23.  
  24. [root@localhost zabbix]# systemctl restart zabbix-server
  25.  
  26. 备注:今天批量添加了700台主机,造成内存溢出。

5、zabbix-server日志报错,提示connection to database ‘zabbix’ failed: [1040] Too many connections错误,mariadb正常。想到应该是mysql最大连接数问题。

修改mysql最大连接数的链接:http://blog.51cto.com/net881004/2089198

 

6、报警提示More than 100 items having missing data for more than 10 minutesZabbix poller processes more than 75% busy错误。

修改配置文件增大线程数和缓存

 
  1. [root@localhost zabbix]#  vim /usr/local/zabbix/etc/zabbix_server.conf
  2.  
  3. StartPollers=500
  4.  
  5. StartPollersUnreachable=50
  6.  
  7. StartTrappers=30
  8.  
  9. StartDiscoverers=6
  10.  
  11. CacheSize=1G
  12.  
  13. CacheUpdateFrequency=300
  14.  
  15. StartDBSyncers=20
  16.  
  17. HistoryCacheSize=512M
  18.  
  19. TrendCacheSize=256M
  20.  
  21. HistoryTextCacheSize=80M
  22.  
  23. ValueCacheSize=1G

7、server日志很多first network error, wait for 15 seconds报错

server配置文件Timeout时间改大点,我改成了30s。

 

8、zabbix告警“Zabbix poller processes more than 75% busy”(网友)

告警原因:
1.某个进程卡住了,
2.僵尸进程出错,太多,导致慢了
3.网络延迟(可忽略)
4.zabbix消耗的内存多了

告警危害:
普通告警,暂无危害(但是最好处理)

 
  1. 处理方法:
  2. 一:简单,粗暴(重启zabbix-server可结合定时任务使用)
  3. service zabbix-server restart
  4. crontab -e 调出Cron编辑器中增加一个计划:
  5. @daily service zabbix-server restart > /dev/null 2>&1
 
  1. 二:编辑Zabbix Server的配置文件/etc/zabbix/zabbix_server.conf,找到配置StartPollers的段落:
  2. ### Option: StartPollers
  3. #       Number of pre-forked instances of pollers.
  4. #
  5. # Mandatory: no
  6. # Range: 0-1000
  7. # Default:
  8. # StartPollers=5
  9. 取消StartPollers=一行的注释或者直接在后面增加:
  10. StartPollers=10
  11. 将StartPollers改成多少取决于服务器的性能和监控的数量,将StartPollers设置成12之后就再没有遇到过警报。如果内存足够的话可以设置更高。

9、早上收到很多报警邮件,官网访问不了,很多服务器端口不通。但是用手机访问官网却可以访问,邮件里面很多Zabbix alerter processes more than 75% busy、Zabbix http poller processes more than 75% busy、和端口不通的报警信息。

由于之前优化过zabbix配置,所以觉得应该不是zabbix配置的问题。可能是那时候zabbix所在网络不通或者延时造成的(确认后是机房那边网络断开了2个小时,恢复后这些报警信息才发送出来了)。看来要针对zabbix服务器本身在异地做个监控,有时间弄个nagios看看。

MMNI :内核参数用于控制整个 Linux 系统中信号集的最大数量。

10.②报错:No route to host处理

今天在客户端配置Zabbix_agentd后,通过自动注册到 Zabbix_Server 页面中,点击主机列表却发现ZBX显示红色,无法被监控到,查看报错为:

No route to host

在客户端telnet服务端的10051端口发现没有问题,服务端telnet 客户端10050端口报错:
telnet 1.1.1.1 10050
Trying 1.1.1.1…
telnet: connect to address 120.27.241.253: No route to host
原来是被客户端的防火墙档掉了,关闭客户端防火墙或者配置相应规则即可

11.④zookeeper不出图

查看日志/var/log/zabbix/zabbix_agentd.log,大量的报错

1404:20161225:183259.913 active check configuration update from [1.1.1.1:10051] started to fail (ZBX_TCP_READ() timed out)

原来是zabbix_sender需要主动向服务器发送数据,而zabbix-server端的10051端口被防火墙挡住了,重新放行端口问题解决

 

更多内容请参考这里

http://www.mmcaijing.com/39156.html


运维搬运工 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 
转载请注明原文链接:zabbix报错排错大全

喜欢 (0)赏分享 (0)

© 著作权归作者所有

l

linjin200

粉丝 26
博文 1005
码字总数 1170031
作品 0
福州
程序员
私信 提问
Zabbix利用JMX监控多实例Tomcat运行状态

自使用Zabbix监控系统以来,一直想用JMX来监控Tomcat,但是一直都没配置成功,总有一些问题,监控端的报错又很抽象,搜索网上大都是复制粘贴之产物,或者是缺斤短两之网文,但是一直都没放弃...

奋斗的寒霜
2018/06/28
0
0
zabbix排错-20180107

问题1: 查看zabbix-server日志发现报错 原因 查看对应主机配置文件,发现主机名未配置: 解决办法: 1、修改hostname与web界面主机名一致 2、重启对应服务器的zabbix客户端 问题2 在zabbix-...

苏黎世1995
2018/01/07
0
0
zabbix源码安装流程及报错解决方法

zabbix源码安装流程及报错解决方法 一. zabbix的介绍 1) zabbix是什么 zabbix是一款基于web页面的、开源的、企业级的,支持分布式部署的监控软件。 2)2.zabbix的作用 监控windows和Linux主机...

JAYZ_HAO
2017/08/22
0
0
系统linux/redhat6.5 zabbix 2.47监控nginx1.8.0 (上)

基本思路: 服务器端(虚拟机1):安装 zabbix-server zabbixget mysql5.7.9 客户端(虚拟机2):安装zabbix-agent nginx1.8.0 服务器和客户端都是使用redhat6.5搭建的 --------------------...

红杉红杉--我是
2016/01/23
544
0
Zabbix添加对Windows 客户端CPU温度的监控

标签:zabbix 温度是监测一台机器运行的重要参数Zabbix预置的模板中没有对CPU温度的监控,所以我们需要使用自定义的KEY对温度进行监测 Windows没有温度监测的组件这时候需要借助第三方软件S...

cstsncv
2017/12/26
0
0

没有更多内容

加载失败,请刷新页面

加载更多

川普给埃尔多安和内堪尼亚胡的信

任性 https://twitter.com/netanyahu/status/1186647558401253377 https://edition.cnn.com/2019/10/16/politics/trump-erdogan-letter/index.htm...

Iridium
28分钟前
10
0
golang-mysql-原生

db.go package mainimport ("database/sql""time"_ "github.com/go-sql-driver/mysql")var (db *sql.DBdsn = "root:123456@tcp(127.0.0.1:3306)/test?charset=u......

李琼涛
56分钟前
5
0
编程作业20191021092341

1编写一个程序,把用分钟表示的时间转换成用小时和分钟表示的时 间。使用#define或const创建一个表示60的符号常量或const变量。通过while 循环让用户重复输入值,直到用户输入小于或等于0的值...

1李嘉焘1
56分钟前
7
0
Netty整合Protobuffer

现在我们都知道,rpc的三要素:IO模型,线程模型,然后就是数据交互模型,即我们说的序列化和反序列化,现在我们来看一下压缩比率最大的二进制序列化方式——Protobuffer,而且该方式是可以跨...

算法之名
今天
19
0
如何用C++实现栈

栈的定义 栈(stack)又名堆栈,它是一种运算受限的线性表。限定仅在表尾进行插入和删除操作的线性表。这一端被称为栈顶,相对地,把另一端称为栈底。向一个栈插入新元素又称作进栈、入栈或压...

BWH_Steven
今天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部