SUSE10 SP2/SP3 无规律死机故障解决
前端时间,在公司内部为华为事业部安装了一台测试服务器,系统是SUSE Enterprise Linux 10 SP2,在最初选择阵列类型的时候,因为是测试机,对容量的需求大于对安全的考虑,因此配置了Raid 0而不是默认的Raid 1。(补充:最近发现不管是Raid 0还是Raid 1只要大量IO操作的时候都会出现此类问题,Raid 0是Raid 1 的IO 2倍,所以Raid 1 出现几率要小些,但不代表不会出现)。
但后面就发生了2次让人非常郁闷的事情,就是系统在毫无征兆的情况下死机了,在死机的时候,系统可以ping通,但无法进行任何操作,包括本地登录都不行。而在强行关机后再重启进入系统一切又完全正常,更郁闷的是无法从系统的任何日志中获取到相关的信息,这样就很难对问题进行定位了。
在这样的情况下,由于系统重新搭建需要耗费太多的精力,于是我们就打算继续观察,而这一次足足持续了接近2周的时间,在我们都认为它已经没有问题的时候,系统再次死机了,依然可以ping通,但无法进行任何操作。
如此一来,只能从各方面进行揣测了,我一边思考着,一边不抱希望的在网络上搜索着资料,结果不经意间,我找到了一份PDF文档,发现了问题的根本原因,并且按照文档中的步骤进行了处理,其相关内容如下:
问题原因:
死机原因为未正确安装阵列卡驱动所致。最常见的故障现象是SUSE10 SP2、SP3 在有大量磁盘IO 时出现IO 中断引起的系统死机,而且通常该服务器可以ping 通。
处理步骤:
1.首先确认HP Smart Array Controllers 阵列卡驱动是否安装
使用root用户登录,执行 modinfo cciss |grep description
确认description 的结果是否为 Driver for HP Controller SA5xxx SA6xxx version
如果是,则证明目前所使用的驱动是SUSE系统的默认驱动,系统并未安装HP Smart Array Controllers 阵列卡驱动。
2.下载HP Smart Array Controllers 阵列卡驱动
相关链接如下:
x86/AMD32 版本(即32位操作系统):
http://h20000.www2.hp.com/bizsupport/TechSupport/SoftwareDescription.jsp?lang=en&cc=us&prodTypeId=15351&prodSeriesId=3884082&swItem=MTX-481f8d81647643d396a84368e7&prodNameId=3884083&swEnvOID=2065&swLang=13&taskId=135&mode=5
AMD64/EM64T 版本(即64位操作系统):
http://h20000.www2.hp.com/bizsupport/TechSupport/SoftwareDescription.jsp?lang=en&cc=us&prodTypeId=15351&prodSeriesId=3884082&swItem=MTX-780e1990218446a29611f0c4a1&prodNameId=3884083&swEnvOID=2078&swLang=13&taskId=135&mode=5
这里需要注意的是,一定要选择对应的操作系统版本,如果将32位驱动误安装到了64位系统中,那么结果会很悲剧的,因为会导致驱动无法卸载和重新安装,因此安装前一定要注意。
如果不清楚操作系统版本,可通过命令 uname -a 查看,带有 64 字样的就是64位系统。
最新的HP SmartArray 阵列卡驱动 支持如下:
Version: 3.6.26-5 支持 2.6.16.60-0.54.5 – SUSE LINUX Enterprise Server 10 SP 3
Version: 3.6.24-5 支持 2.6.16.60-0.21 – SUSE LINUX Enterprise Server 10 SP 2
3.安装驱动
我的系统是SUSE 10.2 64位,因此安装cpq_cciss_3.6.24-5.sles10.x86_64.rpm:
rpm -ivh cpq_cciss_3.6.24-5.sles10.x86_64.rpm
4.升级检查
升级成功后,执行命令 modinfo cciss 检查是否成功。
如果description的结果为 Driver for HP Smart Array Controller version 3.6.24-5
则证明升级OK,此时,为保险起见,最好再重启一下操作系统以使新的驱动得到应用。
HP, SUSE, 驱动
分享到:
相关推荐
包含SUSE12 SP2 的ISO镜像及SDK开发包(官网下载)。CSDN资源大小显示,所以通过百度网盘下载
SUSE 11 SP2安装快速入门
DELL R420\R720\R430等等系列,安装centos/rhel 5.5/6.3/6.4 suse11sp2/sp3的之后,网卡不能找到解决办法; 1、安装驱动包 yum install tg3-3.133e-2.dkms.noarch.rpm或者rpm -ivh tg3-3.133e-2.dkms.noarch.rpm 2、...
日常进行开发安装虚拟机,需要Suse Linux操作系统,官网下载速度忒慢,特上传网盘资源,需要的伙伴可以下载
本文在SUSE12SP2下,通过编译安装方式安装了zabbix3.4.8,并配置和初始化、汉化了zabbix
SuSE Linux Enterprise Server 12 SP2-x86_64下载地址,安全可靠。
SUSE12-SP3 镜像 以及 惠普G10服务器引导驱动镜像。 SUSE12-SP3 镜像 以及 惠普G10服务器引导驱动镜像。
SUSE Linux Enterprise Server 15 SP3 自动化部署脚本,命令行版,图形化版本自动化脚本 openssl passwd -1 -stdin 生成密码 账号root/1234.com 867行更改(此处是主机的密码$1$1rqHEpcL$B6DVO/fpXQq9DZe3g4nmH.</...
suse12 sp2 gcc和g++资源库。下载后,解压,并赋予足够的执行权限,一键安装。
susesuse 11 sp3下载地址,官网下载太慢了,而且经常中断。
suse 10_sp2系统基于ip-san组网指导书
SLE-12-SP3-Server-DVD-x86_64-GM-DVD SLE-15-Installer-DVD-x86_64-GM-DVD SLE-15-Packages-x86_64-GM-DVD
SuSE Linux Enterprise Server 12 SP2-x86_64下载地址,安全可靠。
本文在SUSE12SP2下,通过docker的rpm包安装了docker,并解决了依赖报错等问题,成功启动docker
SUSE 12 SP2 for sap ha环境搭建
SUSE_企业版_12sp2_dvd1 网盘下载链接,64位,非opensuse。
Suse11 Enterprise SP3 安装Oracle 12c RAC 图文详细教程
SUSE Linux Enterprise Server 12 SP2-x86_64 链接:https://pan.baidu.com/s/1Njy_b62CSrWBimikSZ2IIA 提取码见附件 server版两个iso文件,总共近10G
SUSE Linux 10 SP2关闭IPV6及防火墙.docx
Suse11sp3配置双网卡绑定