数据安全大体上可分为传输安全和存储安全。传输安全指在数据的生成、传输和访问过程中,确保数据的完整性、准确性及排他性。黑客、防火墙等,均属传输安全的概念。存储安全指在数据保存上确保完整、可靠和有效调用,通常包括两层含义:一是存储设备自身的可靠性和可用性(设备安全),二是保存在存储设备上数据的逻辑安全(应用安全)。本文着重剖析实现存储安全的必备要素和常见误区,以便为企业和机构提供建设性指南。
RAID——获取设备安全的主要工具
1988年,在整个计算机业界为提高磁盘,尤其是大容量磁盘的性能和可靠性苦苦挣扎时,美国加州伯克利大学的Patterson等人发表了《A Case for Redundant Arrays of Inexpensive Disks (RAID)》,以革命性的思路指出,利用多个独立小磁盘组成的冗余阵列构建逻辑大磁盘,可便利地实现高性能和高可靠性,RAID行业从此兴起。
的确,虽然20余年来磁盘技术飞速发展,单盘容量与存取速度均有了长足提高,存储系统的设备安全仍然是以RAID为基石。RAID技术带来的设备安全具备两层含义:
高可靠——设备故障时,在降级状态下依然能够完成数据存储工作;
高可用——设备故障时,系统可便利恢复容错能力,走出降级状态。
RAID应用的发展经历了纯软件、内置板卡和独立外设三个阶段。纯软件和内置板卡RAID成本较低,但占用主机资源,性能受限且难于优化,尤其是与应用系统没有解耦,当主机环境损毁时,若不能保证完全恢复配置,可能导致盘阵中的数据无法恢复。因此,目前中高档RAID系统均已采用独立外设的形式。
RAID——对应用安全无能为力
主机操作系统及其上应用程序运行所产生的数据,一般被称为在线数据。保存在线数据的存储系统因之也被称为在线存储。近两年来业界热炒的近线存储,本质上属于在线存储的范畴,只是将在线数据中访问频次较低的数据存放到二级介质中,以节约投资成本。
对在线存储的核心要求是保障应用灵活性,具体体现为小数据量的频繁、随机和并行读写。这一方面要求存储介质具备相应特长——SCSI磁盘以及FC磁盘应运而生,另一方面则要求数据能够被操作系统直接访问,保存为特定操作系统的文件格式以便快速寻址。
操作系统是在线应用的核心。权威的计算机系统安全标准之一,美国国家计算机安全中心颁布的橘皮书(Trusted Computer System Evaluation Criteria,即受信任计算机系统评量基准)指出,操作系统的易用性与安全性无法兼顾,广泛使用的商用操作系统,如Windows、各类Unix、Linux等,均属于中等安全的C1或C2级别。
因此操作系统对于数据来说是不安全的,因为在这些通用平台中,用户或应用程序可以很容易地对数据和文件进行任何操作,包括添加、删除、修改等。人为的有意或无意误操作、病毒的破坏、应用软件的Bug、程序运行冲突等,均可能导致在线数据丢失。
因此,在线系统保障应用灵活性的代价是牺牲应用安全。一个“好”主机可保万事大吉的想法是一种可怕的谬种流传,数据备份——应用安全的惟一保障迄今为止,保障应用安全的惟一方式是数据备份。
数据备份的目的是周期性保存在线数据的历史,以便在线数据发生损坏时,使用备份数据恢复到错误发生之前的状态,以确保数据的正常访问。备份以保障数据存储安全为首要目的,通过严格的备份策略、流程等一系列手段确保数据应用不会对备份数据的安全产生影响。
“9·11”事件后,世界金融市场的大动荡提供了一个骇人的警告。据美国德州大学调查显示,IT应用发展到今日美国的水平,灾难性数据丢失会使94%的公司在两年之内倒闭。从概念上讲,备份是为数据购买保险。IT应用水平愈高,数据就愈成为机构的生命线,所以在进入知识经济的今天,在备份上心存侥幸, 无异于将企业主体资产用于高风险赌博。
存档与备份的区别
正如生命周期理论将在线数据分级为在线和近线数据一样,离线数据亦可分为备份与存档数据,以降低投资和运维成本。
存档的目的是将需要长期备查或转移到异地保存/恢复的数据存放到可移动存储介质上。严格意义上讲,存档的目的不是为了保障数据安全,而只是为了实现数据仓储。如果说备份相当于桌头的字典,工作时会经常翻用,存档则好像日常工作中生成的一些具长期保存价值的文字资料,被转移到书架上或档案馆里备查。
因此,虽然存档数据量在长时间累计后总量可以很大,但在良好设计的存储系统中的单个备份周期内,存档量一般只有备份量的几分之一甚至几十分之一。