笔者多年同服务器阵列打交道,在服务器阵列方面积累了丰富实战经验,今天在此就磁盘阵列常见故障类型进行归纳。
磁盘阵列是把多个小型廉价的磁盘驱动器合并成一组阵列,来达到大型昂贵的驱动器所无法达到的性能或冗余性。这个驱动器阵列在计算机眼中就如同一个单一的逻辑贮存单元或驱动器。
磁盘阵列是一种在多个磁盘上分散信息的方法。它使用磁盘分条(diskstriping,RAID0)、磁盘镜像(diskmirroring,RAID1)、和带有奇偶校验的磁盘分条(disk striping with parity,RAID5)之类的技术来达到冗余性,减低潜伏时间,并且(或者)增加磁盘读写的带宽,提高从硬盘崩溃中恢复的能力。
一般常见故障类型有以下几种情况,当发生以下情况,数据会发生丢失:
磁盘阵列出错
具体原因有,阵列卡损坏、阵列卡电池电力耗尽、槽口控制芯片损坏等。这类情况的数据恢复率相当高,但也有失败的案例。比如板载的控制程序出错,发生大规模混乱的数据读写(误Rebuild等操作)是相当危险的。
建议当遇到阵列出错,数据丢失时,不要做任何操作,第一时间与华军深圳数据恢复中心联系。
注意:当发生阵列卡损坏时,随意更换新的阵列卡极易造成磁盘ID号紊乱。
系统故障
当发生系统故障甚至是系统崩溃时,一些用系统自带功能(Ms windows,Unix,Linux,Sun solaris等)创建的磁盘阵列或者用第三方软件(Diskmanagement,Veritas disk management等)组建的磁盘阵列会发生数据丢失。这时,阵列日志和相关记录是相当重要的,如果您有详细的系统日志甚至是阵列组合信息备份,您可拨打华军深圳数据恢复中心热线为您解决问题。当然万一您没有相关的信息,也请您不要着急,华军深圳数据恢复中心多年经验的数据恢复工程师会帮您渡过难关。
磁盘故障
虽然有的磁盘阵列容许1-2块硬盘故障而数据不丢失。然而由于管理不善和服务器相对稳定的特性对管理者造成麻痹,发生超出允许数量坏硬盘的事故屡屡发生(RAID-5损坏两块硬盘)。
提高管理质量和重视程度是解决此类问题的根本方法。
当然,万一您的身边有此类事件发生时,请及时和我们联系。
一旦RAID阵列出现故障,硬件服务商只能给客户重新初始化或者REBUILD,这样客户数据就会无法挽回。我们对RAID0、RAID1、RAID5以及组合型的RAID系列磁盘阵列数据恢复具有丰富的实践经验,出现故障以后只要不对阵列作初始化操作,我们就有能力恢复出故障阵列的数据。
磁盘阵列其他故障:
系统不能启动
RAID信息破坏
由于某块硬盘掉线,替换后重建失败,系统崩溃
RAID信息丢失
硬盘(单块或多块)掉线
RAID卡损坏,更换后系统崩溃
分区信息丢失
硬盘坏道(物理、逻辑)
重新配置RAID阵列信息
磁盘顺序出错
动态磁盘数据库丢失或损坏
LINUX、UNIX系统启动不成功,或者分区不能mount,找不到分区
rebuild中途失败
rebuild成功后,分区找不到或者系统不能启动
红灯不停闪,或者黄灯不停闪(有的黄灯闪表示正在读取,有的是错误指示)
MBR损坏
DBR损坏
磁盘单块坏道
磁盘多块坏道