如何应对灾难恢复分级系统中的第三级和第四级灾难?即当数据丢失或系统崩溃后应当如何处理。
灾难等级3——损失一部分非关键性数据,或者一个非关键系统崩溃。
灾难等级4——损失大量非关键性数据,或者一个关键性系统崩溃。
第三级的数据灾难包括一部分的数据损失,这也许有由于备份磁带的数据无法完全恢复,或者非关键性的系统崩溃造成的。当这种情况出现后,对IT人员的响应速度要求并不是很高,最终用户很可能还能继续进行正常的业务应用,数据或系统损失可能对他们没有什么影响。但这并不意味着你的员工可以放任这部分数据丢失或系统宕机而没有作为。你需要检查出系统哪里出现了问题,并确保损失已经得到了控制。也就是说你要检查其它数据系统的备份系统,试着还原系统或者之前备份的数据,并找出问题的根源。这里你的目标就是确保系统不再丢失数据,以及关键系统不会出现问题。一旦你找出了问题的原因,就可以开始着手解决了。解决问题的方法可以是尽快重新安装崩溃的系统,并且尽力将没有遭破坏的数据恢复,同时运行反病毒软件以及其它安全措施来确保新系统和数据是安全的,之后在运行业务所需的应用,让新系统和数据能够正常工作。
第四级的数据灾难对恢复时间有比较强的要求。这一级别的灾难是指大范围的数据丢失,以及一个或多个关键性系统崩溃。在这种情况下,你基本上没有时间进行系统性的工作,而是必需以最快速度进行处理,不论这种情况是发生在工作日还是你睡得正香的时候。比如机房发生小范围的火警,如果做不到及时处理,第一现场可能出现更严重的破坏,导致更加惨重的数据损失,让你不得不花更长的时间进行恢复。你首先要做的就是尽快恢复任何你能保证没有受到损坏的数据,如果你有任何可用的解决方案(失效转移系统),应该立即将你的关键数据系统转移到其上,并让其恢复运行。应对这一等级灾难的原则就是首先尽快恢复尽量多的数据和服务,这样最终用户就可以利用这些系统继续进行工作,之后才是需要检查原因。面对第四级灾难,在恢复各种关键性服务之前,先不要全面进行灾难发生原因的调查,因为你没有足够的时间做这些。
另外,在恢复服务时,一定要尽量小心。如果移动数据的动作太快,你的IT员工有可能在移动过程中将原本完好的数据破坏掉,这将加大灾难的复杂程度。转移的速度过快,转移过程中的错误配置,或者其它突发事件,都会导致更严重的数据损失。因此,不论管理者如何催促,快速而冷静的进行抢救工作才是最正确的。如果你有一套失效转移系统,那么快速检查一下系统的稳定性,然后通过它来恢复业务服务。如果该失效转移系统并不稳定,那么你可以适当的改变数据恢复过程。
对于 第三和第四级灾难,在你处理完最初的工作后,应该详细的检查到底损失了多少数据,这样最终用户可以手动进行数据恢复工作。这意味着你也许需要通过硬拷贝的方式录入数据,向使用数据的客户发出报警信息,以及准备详尽的损失报告。这一切都要在你确定了数据损失情况以及数据可恢复情况之后才能进行。
有数据损失的灾难一向都是难以应对的。IT员工在紧急情况下承受的巨大压力可能会导致操作上的失误,使得入侵者有机会再次进入网络,令数据受到进一步的损失。在周围的人面对灾难手足无措或者大呼小叫时,要想做到快速而有条理的应对灾难可能很困难,但这是尽量挽回数据并尽快让系统继续运作的唯一方式。