文档章节

Debian Gnu/Linux 8.7故障处理实例

晒太阳的小猪
 晒太阳的小猪
发布于 2017/03/21 09:55
字数 1024
阅读 47
收藏 0
Debian Gnu/Linux 8.7故障处理实例
os:Debian Gnu/Linux 8.7
kernel:Linux localhost 4.9.0-0.bpo.2-amd64 #1 SMP Debian 4.9.13-1~bpo8+1 (2017-02-27) x86_64 GNU/Linux
浏览器:Chrome 57.0.2987.110 (64-bit)
显卡1NVIDIA Corporation G98 [GeForce G 100] (rev a1)
显卡2Intel Corporation 4 Series Chipset Integrated Graphics Controller (rev 03)

最近使用计算机发现系统总是莫名奇妙的发生黑屏现象,主机正在使用中会突然黑屏。开机后也不能确定何时又会出现黑屏,感觉故障非常的随机。而且故障出现频次越来越频繁,影响主机正常使用。今天主机再次黑屏,等待数分钟后开机并决定查找具体原因。

开机后使用cat /var/log/messages | grep error查看,没有发现太多异常。使用tail /var/log/messages只能看到末尾部分,但因为日志生成太快,同样掠过很多重要日志记录。于是使用

tail -n 1500 /var/log/messages > messageslog.log

进行处理,使用emacs messageslog.log,找到宕机时间段,发现大量类似

18163:Mar 14 03:44:26 xianbirdofprey8400e kernel: [404095.799973] nouveau 0000:01:00.0: therm: temperature (96 C) hit the 'downclock' threshold

信息。

再次使用

cat /var/log/messages | grep temperatuer

关键字发现shutdown关键字,于是再次使用

cat /var/log/messages | grep temperatuer | grep shutdown

发现如下内容:

766:104034:Mar 16 17:27:29 xianbirdofprey8400e kernel: [626278.751662] nouveau 0000:01:00.0: therm: temperature (136 C) hit the 'shutdown' threshold
767:104035:Mar 16 17:27:35 xianbirdofprey8400e kernel: [626284.334786] nouveau 0000:01:00.0: therm: temperature (124 C) went below the 'shutdown' threshold
814:108656:Mar 17 11:36:35 xianbirdofprey8400e kernel: [63454.189739] nouveau 0000:01:00.0: therm: temperature (136 C) hit the 'shutdown' threshold

从时间上看刚好接近主机黑屏时的时间,但无法确定故障具体原因。上万能的百度(oschina.net)发帖寻求帮助。知道了原来可以在Linux系统中安装sensors以及xsensors查看设备温度,赶快使用apt-get install xsensors sensors安装软件,并使用sensors进行查看:

14:58:49[root@xianbirdofprey8400e /proc]# sensors
coretemp-isa-0000
Adapter: ISA adapter 
Core 0:   +45.0°C  (high = +80.0°C, crit = +100.0°C) 
Core 1:   +45.0°C  (high = +80.0°C, crit = +100.0°C) 

nouveau-pci-0100 
Adapter: PCI adapter 
temp1:   +112.0°C  (high = +95.0°C, hyst =  +3.0°C)  
   (crit = +122.0°C, hyst =  +2.0°C) 
   (emerg = +135.0°C, hyst =  +5.0°C)

显卡温度已经接近关机温度。4分钟后主机自主关闭(很销魂的自主动作) 再次开机使用cat /var/log/messages | grep temperatuer | grep shutdown命令查看日志显示如下:

766:104034:Mar 16 17:27:29 xianbirdofprey8400e kernel: [626278.751662] nouveau 0000:01:00.0: therm: temperature (136 C) hit the 'shutdown' threshold
767:104035:Mar 16 17:27:35 xianbirdofprey8400e kernel: [626284.334786] nouveau 0000:01:00.0: therm: temperature (124 C) went below the 'shutdown' threshold
814:108656:Mar 17 11:36:35 xianbirdofprey8400e kernel: [63454.189739] nouveau 0000:01:00.0: therm: temperature (136 C) hit the 'shutdown' threshold
844:110541:Mar 17 15:02:54 xianbirdofprey8400e kernel: [12040.904513] nouveau 0000:01:00.0: therm: temperature (136 C) hit the 'shutdown' threshold

同时使用xsensors查看显卡温度,升温及其迅速,很快就到了90°C,多跑几个应用就可以达到135°C,然后系统就销魂的黑屏。

打开机箱开机观察,发现显卡风扇转速缓慢,至此问题定位结束

本机外置N卡损坏后,直接用本机集成显卡代替,但有时使用Chrome打开网页时,系统会挂起,切换到终端模式下,发下系统报如下错误:
[drm:drm_atomic_helper_commit_cleanup_done [drm_kms_helper]] *ERROR* [CRTC:26:pipe A] flip_done timed out
网上查找资料,发现该问题似乎从内核4.8之后就一直存在,这是一个与视频驱动程序相关的错误,特别是对于intel内核DRM
解决方法:
按照bbs.archlinux.org论坛中给的解决方法需要按如下操作完成。
1、使用命令vi /etc/default/grub修改GRUB_CMDLINE_LINUX_DEFAULT行内容如下:GRUB_CMDLINE_LINUX_DEFAULT="video=SVIDEO-1:d quiet"
2、使用命令update-grub更新Grub并重新启动系统。
 3   、打开chrome流浪器,使用Ctrl+F,搜索GPU,并将相关项关闭。
至此系统恢复稳定运行。以上问题对于其它Linux发行版处理过程稍有不同,但基本命令以及配置方法具有通用性。其他发行版Linux可以如有该问题可以进行借鉴

© 著作权归作者所有

晒太阳的小猪

晒太阳的小猪

粉丝 43
博文 46
码字总数 25261
作品 0
安康
系统管理员
私信 提问
Q4OS 1.8.2,首个基于 Debian 8.7 的 Linux 系统

基于最近发布的 Debian GNU/Linux 8.7 "Jessie" 操作系统,Q4OS 1.8.2 "Orion" 现在是该发行版的最新版本,修复了 173 个 bug,并通过新的 Debian GNU/Linux 发行中的 Debian 项目实现了安全......

局长
2017/01/17
1K
5
Emmabuntus 8-1.02 发布,基于 Xubuntu 的桌面 Linux 发行

Emmabuntus 项目宣布发布了 Debian 发行版的稳定版本,新版本基于 Debian 8.7 并具有 Xfce 桌面环境。 新 Emmabuntus 的 Debian 版本默认使用 Lilo 搜素引擎,并包括在启用 UEFI 的计算机上运...

局长
2017/03/21
845
0
ExTiX 17.4 发布,基于 Ubuntu 17.04

ExTiX 17.4 发布了,ExTiX 是基于 Ubuntu 的桌面 Linux 发行。 ExTiX 17.4似乎是继 Ultimate Edition 5.4之后基于Canonical最新Ubuntu 17.04(Zesty Zapus)操作系统的第二个发行版,同时,被...

两味真火
2017/04/20
2.4K
0
Debian 10 "Buster” 即将发布:Debian 11 和 12 代号确定

在我们等待Debian GNU/Linux 10 “Buster”操作系统发布的时候,Debian发布团队宣布了接下来两个即将发布的版本的代号。 Debian GNU / Linux 10“Buster”已经进入开发周期的一半,发布团队最...

linux-tao
2018/04/28
0
0
Debian GNU/Linux 8.4与7.10正式发布

导读 2016年4月2号的时候,Debian Project正式发布了Debian GNU/Linux 8.4(Jessie)和Debian GNU/Linux 7.10(Wheezy)维护更新。 Debian GNU/Linux 8.4 "Jessie"是广受好评的该系列操作系统......

linuxprobe
2016/04/07
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Linux的基本命令

目录的操作命令(增删改查) 增: mkdir 目录名称; 查: ls 可以看到该目录下的所有的目录和文件 ls -a,可以看到该目录下的所有文件和目录,包括隐藏的 ls -l,可以看到该目录下的所有目录和...

凹凸凸
今天
2
0
在古老unix中增加新用户

Installing 4.3 BSD Quasijarus on SIMH 目标:要在4.3BSD中新增加用户dmr,指定目录/home/dmr,uid为10 gid=31(guest组,系统已建立) 4.3BSD还没有adduser或useradd 直接修改/etc/passwd...

wangxuwei
今天
2
0
Bootstrap(六)表单样式

基本样式 所有设置了 .form-control 类的 <input>、<textarea> 和 <select> 元素都将被默认设置宽度属性为 width: 100%;。 将 label 元素和前面提到的控件包裹在 .form-group 中可以获得最好...

ZeroBit
昨天
3
0
SSL 证书格式转换

SSL 证书格式转换 不同服务器情况下,需要不同的证书格式。 比如 pem 转 pfx。 pem在window 平台下可以导入,但是无法正常使用。 需要转换成pfx。 推荐在线转换工具,由中国数字证书网站提供...

DrChenXX
昨天
2
0
HAProxy

xx

Canaan_
昨天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部