Raid阵列的监控还是很有必要的

现在构建的Raid 6阵列 , 通过Zabbix来监控健康状态

前几天出现报警

才开始是 LSIMegaRaid: Adapter 0 Enclosure 61 Slot 11 Predictive Failure Count

这是预测的硬盘要阵亡了 , 然后接着就是 各种错误

LSIMegaRaid: Adapter 0 Enclosure 61 Slot 11 has flagged a S.M.A.R.T alert 9m 40s No 1 action Application: LSI_MegaRaid Phisical Disks
LSIMegaRaid: Adapter 0 Enclosure 61 Slot 11 Other Error Count 9m 40s No 1 action Application: LSI_MegaRaid Phisical Disks
LSIMegaRaid: Adapter 0 Enclosure 61 Slot 11 Media Error Count 9m 40s No 1 action Application: LSI_MegaRaid Phisical Disks

最后 就Fail了 , 在MEGACLI看到状态变为

Enclosure Device ID: 61
Slot Number: 11
Enclosure position: 1
Sequence Number: 4
Firmware state: Failed
Emergency Spare : No

代表阵亡了 , 换硬盘,热插拔,在rebuild 就可以了

Raid 6 可以坏二块硬盘,前几天另外一台坏了2块。。。。。。


发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注