这里说的RAID-5EE故障,是指RAID-5EE逻辑盘丢失或不可访问。导致RAID-5EE故障的原因主要有以下几种:
1.RAID控制器出现物理故障
RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-5EE中各个物理成员盘的控制。在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。
2.RAID信息出错
RAID控制器将物理盘配置为RAID-5EE后,会生成一些参数,包括该RAID-5EE的盘序、条带大小、左右结构情况、同步异步情况、RAID-5EE在每块物理盘中的起始地址等,还会记录有关该RAID-5EE的相关信息,包括组成该RAID-5EE的物理盘数目、物理盘的容量大小等,所有这些信息和参数就被称为RAID信息,也称为RAID元数据。它们会被保存到RAID控制器中,有时候也会保存到RAID-5EE的成员盘中。
RAID信息出错就是指该RAID-5EE的配置信息和参数出现错误,导致RAID程序不能正确地组织管理RAID-5EE中的成员盘,从而导致RAID-5EE逻辑盘丢失或不能访问。
3.RAID-5EE成员盘出现物理故障
RAID-5EE中一块成员盘离线后,剩下的成员盘会计算生成离线成员盘的数据并写入热备空间内,如果在这个过程还没有完成的情况下又有一块成员盘离线,RAID-5EE就会崩溃。
4.人为误操作
如果误将RAID-5EE中两块以上成员盘同时拔出,或者给RAID-5EE除尘时将成员盘拔出后忘了原来的顺序,以及不小心删除了RAID-5EE的配置信息等,都会造成RAID-5EE崩溃。
5.RAID控制器的稳定性
RAID-5EE的数据分布结构中存在校验块和热备块,当RAID-5EE中有成员盘离线时,算法将变得非常复杂,RAID控制器将会工作在一个比较吃力的状态。而RAID控制器的负载太重便会极大地增加数据读/写时出现I/O滞留的可能性,从而导致更多成员盘离线,或者导致RAID信息出错。