1.故障描述
客户一台RH5885 V3 服务器,服务器slot1和slot2配置raid1安装系统,slot3~8配置单盘raid1存储hadoop数据,近期sde硬盘故障需要更换。
2.故障分析
如何通过硬盘盘符sde查询硬盘槽位?两种查询方法,一种是Linux系统命令行方式查询,一种是SmartKit收集日志方式查询。
2.1.Linux系统命令行方式查询
1)通过smart信息确认硬盘序列号 在OS下执行smartctl -a /dev/sdd命令,打印信息中“Serial Number”对应的信息即为硬盘序列号。如下所示,“Serial Number”为16F1K00TFJZC。
$ smartctl -a /dev/sdd
smartctl 6.4 2015-06-04 r4109 [x86_64-linux-3.10.0-862.el7.x86_64] (local build)
Copyright (C) 2002-15, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: MG04ACA600E
Serial Number: 16F1K00TFJZC
LU WWN Device Id: 5 000039 6cb70234d
Firmware Version: FSCJ
User Capacity: 6,001,175,126,016 bytes [6.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ATA8-ACS (minor revision not indicated)
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Fri Jan 4 17:07:21 2019 CST
SMART support is: Available – device has SMART capability.
SMART support is: Enabled
2)通过硬盘序列号确认硬盘槽位号 a.安装storcli64工具 LSI官网下载Latest MegaRAID StorCLI下载地址:http://www.lsi.com/downloads/Public/RAID%20Controllers/RAID%20Controllers%20Common%20Files/1.14.12_StorCLI.zip 安装StorCLI:
To install StorCLI, perform the following steps:
1. Unzip the StorCLI package.
2. To install the StorCLI RPM, run the rpm -ivh <StorCLI-x.xx-x.noarch.rpm> command.
storcli64所在路径为/opt/MegaRAID/storcli/storcli6 b.查询所有硬盘信息,并将查询到的信息保存为txt文档
storcli64 /call/eall/sall show all > /home/slot.txt
c.slot.txt文档中,查找步骤2.1中所查询到的硬盘序列号 在查找到的硬盘序列号所在的硬盘信息中/c0/e29/s5中s5的5即为硬盘槽位号
d.硬盘亮灯
storcli64 /c0/e29/s5 start locate
storcli64 /c0/e29/s5 stop locate
备注: storcli64 /c0/e29/s5 start locate命令的/c0/e29/s5的0、29、5分别表示硬盘所在RAID卡的ID号、Enclosure的ID号和硬盘槽位号,其中RAID卡的ID号和Enclosure的ID号可在步骤2.2中查找到的硬盘序列号所在的硬盘信息中查询到。
2.2 通过硬盘序列号确认硬盘槽位号(其他)
2.3 SmartKit收集日志方式查询
a.SmartKit日志收集 将SmartKit安装目录Huawei SmartKit\\tools\\ServerInspect\\tools\\InfoCollect\\tools下的“InfoCollect_Linux.tar.gz”文件,拷贝至服务器Linux操作系统。
解压InfoCollect_Linux.tar.gz
$ tar -zxvf InfoCollect_Linux.tar.gz
然后执行./infoCollect.sh命令,收集日志。
b.通过smart信息确认硬盘序列号 在收集的/disk/disk_smart.txt日志文件中,查找“smartctl -a /dev/sdd”字段,查看其对应的内容中“Serial Number”对应的信息
c.通过硬盘序列号确认硬盘槽位号 在收集的/raid/sasraidlog.txt日志文件中查找步骤1中所查询到的硬盘序列号“16F1K00TFJZC”。硬盘序列号所在的硬盘信息中的“Slot Number”对应的信息即为硬盘槽位号信息。
d.使用storcli64 /c0/e29/s5 start locate命令点亮硬盘定位指示灯或查找对应服务器的用户指南以确定硬盘的物理位置。定位完成后可使用storcli64 /c0/e29/s5 stop locate命令关闭硬盘定位指示灯。
评论前必须登录!
注册