大数据时代,巨大的数据量,如何保证其完整性和可靠性,成为业界厂商和专家普遍关注的问题。
目前,业界普遍采用传统的RAID技术来保护数据,但传统的RAID技术有其固有的不足之处。以RAID5为例,当一个RAID组中同时有两块磁盘发生故障的时候,传统的RAID便会进入到失效模式,一旦进入到这个模式,整个RAID上的数据将无法读出,数据也无法继续写入,如果要想恢复RAID的读写功能,必须重建RAID组,代价则是数据全部丢失。另外,在使用健康盘替换故障盘后,RAID组需要进行重构。随着硬盘容量的快速增长,硬盘读写速度受磁盘转速等多方面影响,重构时间变得越来越长。以一块2TB 7.2K rpm盘为例,重构时平均写入速度为30M/s左右,完成重构时间长达18个小时,因此重构过程中出现新的坏盘概率大大增加,数据丢失的风险也大大增加。因此传统RAID技术已无法满足在系统中使用现代大容量硬盘的要求。
然而,在某些领域并非要求数据一点不能丢失。对客户而言,重要的是发生故障后如何快速的将系统恢复到正常状态,以及如何保证正常存储磁盘中数据的可用性。对于视频监控系统而言,如果视频数据完整性受到轻微破坏后,视频数据就无法播放将是难以接受的。如果这种情况下视频数据可以正常播放,只是在播放时出现偶尔的模糊,并不会影响客户的正常使用。
传统RAID技术在处理失效RAID组中正常数据盘的处理办法过于简单,存在很大的优化空间。华为公司研发人员为了更大程度的保护客户的数据,同时更加切合视频监控业务,以失效RAID组中的正常磁盘为出发点,开发出一种可正常读出失效RAID组中正常磁盘数据的解决方案。当RAID组发生失效时,让RAID组自动进入只读模式,此时RAID组中正常磁盘的数据依然可读。以10块数据盘的RAID5为例,当其中两块磁盘发生故障后,对于传统的RAID组而言,10块数据盘上面的数据将会全部丢失;而采用华为解决方案后,除了两块故障盘上面的数据无法读取外,剩下8块磁盘上面的数据可以完好的读出来。也就是说,相比于传统的RAID技术10块磁盘数据全部丢失的情况下,华为解决方案可以保留整整8块磁盘的数据,这大大提升了故障情况下的数据可读性。
在RAID组发生故障后,如何快速的将RAID组恢复到正常状态成为当务之急。对于传统RAID组,在故障盘被健康盘替换后,RAID组需要进行重构,以前的数据全部丢失。随着磁盘容量的快速增长,重构时间越来越长,大大增加新盘的故障率。对于传统RAID存在的这些问题,华为开发出自己的解决方案。当RAID组中失效盘被替换为健康盘时,RAID组自动变为可读可写的正常模式,而不需要删除、重建RAID组。恢复正常之后,RAID组上残留的数据依然存在,且恢复之后新写入的数据也是完整的。
飞客数据恢复工程师经过长期以来,对存储技术的刻苦钻研有了一些心得,并与大家分享讨论...
1.若单个硬盘失效,尝试热插拔,即拔下来再插上去;如果不能解决,则进入RAID配置界面,...
当Emmis数据库出现置疑时,教你你如何修复它!
在整个数据恢复业务中,服务器阵列数据恢复是一大难点,不仅考验工程师素养,还非常考验...
品牌容量: 三星 SSD 固态硬盘 128G 故障描述:今天用硬盘时发现许多资料的文件名变...
硬盘不认而使数据丢失的例子真是数不胜数。每天网上都会有这种情况出现,数据恢复公司,...
当硬盘出现损坏了,硬盘通电咔咔响,相信很多人都遇到过,但是从来不知道出现异响后,我...