这里说的RAID-10故障,是指RAID-10逻辑盘丢失或不可访问。导致RAID-10故障的原因主要有以下几种:
1.RAID控制器出现物理故障
RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-10中各个物理成员盘的控制。在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。
2.RAID信息出错
RAID控制器将物理盘配置为RAID-10后,会生成一些参数,包括该RAID-10的盘序、条带大小、RAID-10在每块物理盘中的起始地址等,还会记录有关该RAID-10的相关信息,包括组成该RAID-10的物理盘数目、物理盘的容量大小等,所有这些信息和参数就被称为RAID信息,也称为RAID元数据。它们会被保存到RAID控制器中,有时候也会保存到RAID-10的成员盘中。
RAID信息出错就是指该RAID-10的配置信息和参数出现错误,导致RAID程序不能正确地组织管理RAID-10中的成员盘,从而导致RAID-10逻辑盘丢失或不能访问。
3.RAID-10成员盘出现物理故障
RAID-10其实是由多组RAID-1构成RAID-0,它可以允许每组RAID-1中的一块成员盘离线,如果某组RAID-1中的某一块成员盘出现物理故障,如电路损坏、磁头损坏、固件损坏、出现坏扇区等,该成员盘就不能正常使用,但该组RAID-1剩下的一块成员盘中的数据完好无损,RAID-10还不会崩溃。
如果系统管理员没有及时替换出现故障的成员盘,当同一组RAID-1中另一块成员盘再出现故障离线后,也就是一组RAID-1中的两块成员盘都出现故障,RAID-10将彻底崩溃。
4.人为误操作
如果误将RAID-10中同一组RAID-1的两块成员盘都拔出,或者给RAID-10除尘时将成员盘拔出后忘了原来的顺序,以及不小心删除了RAID-10的配置信息等,都会造成RAID-10崩溃。