在RAID磁盘阵列数据恢复中,我们常常要涉及到一个专用名词“LUN”,今天笔者就讲讲什么是RAID磁盘阵列数据恢复中的LUN。
LUN是什么?
LUN ID不等于某个设备,只是个号码而已,不代表任何实体属性,在我们的实际环境里,我们碰到的LUN可能是磁盘空间,可能是磁带机,或者是media changer等等.
LUN的神秘之处(相对于一些新手来说)在于,它很多时候不是什么可见的实体,而是一些虚拟的对象。比如一个阵列柜,主机那边看作是一个target device,那为了某些特殊需要,我们要将磁盘阵列柜的磁盘空间划分成若干个小的单元给主机来用,于是就产生了一些什么逻辑驱动器的说法,也就是比target device级别更低的逻辑对象,我们习惯于把这些更小的磁盘资源称之为LUN0,LUN1,LUN2....什么的。而操作系统的机制使然,操作系统识别的最小存储对象级别就是LUN device,这是一个逻辑对象,所以很多时候被称之为logical device。
有人说,我的windows里,就认到一个磁盘呀,没看到什么LUN的说法,是不是LUN=physical disk呢?回答是否定的,只要你注意,磁盘的属性里就可以看到有一个LUN的值,只是因为你的disk没有被划分为多个存储资源对象,而将整个磁盘当作一个LUN来用,LUN ID默认为零,如此而已。
我们曾经碰到过这样的问题,比如有人问,我们有一个磁盘阵列,连到了两个主机上,我们划分了一个LUN给两个主机认到,然后我们想,先在操作系统将磁盘分为两个区,让两个主机分别使用两个分区,然后再出现某一台主机宕机之后,使用集群软件将该分区切换到另外一个主机上去,这样可行吗?答案也是否定的,集群软件操作的磁盘单元是LUN,而不是分区,所以该操作是不可行的。当然,在一些环境,一般也是一些要求比较低的环境,可以在多个主机上挂载不同的磁盘分区,但是这种情况下,实际上是没有涉及到磁盘的切换的,所以在一些高要求的环境里,这种情况根本就不允许存在。
还要说明的地方是,在有些厂商和有些产品的概念里, LUN ID被绑定到了具体的device上,比如ibm的一些带库,整个带库只有一个target ID,然后changer,tape drive被分别分配为LUN0,LUN1,LUN2.....,但是我们要注意到,这只是产品做了特别设计,也是少数情况。
LUN 的概念
LUN的全称是logical unit number,也就是逻辑单元号。我们知道scsi总线上可挂接的设备数量是有限的,一般为6个或者15个,我们可以用target ID(也有称为scsi ID的)来描述这些设备,设备只要一加入系统,就有一个代号,我们在区别设备的时候,只要说几号几号就ok了。
而实际上我们需要用来描述的对象,是远远超过该数字的,于是我们引进了LUN的概念,也就是说LUN ID的作用就是扩充了target ID。每个target下都可以有多个LUN device,我们通常简称LUN device为LUN,这样就可以说每个设备的描述就有原来的target x变成target x LUN y了,那么显而易见的,我们描述设备的能力增强了。
所以我们可以总结一下,LUN就是我们为了使用和描述更多设备及对象而引进的一个方法而已,一点也没什么特别的地方
存储和主机的电气独立时代的LUN的概念
还有很多新手总是把阵列里面的磁盘和主机的内部磁盘的一些概念搞混淆了。
在磁盘阵列和磁带库大行其道的时代,存储越来越智能化,越来越像一个独立的机器,实际上存储和主机的电气独立本来就是一个必然趋势,俗话说得好,儿大要分家嘛。在存储越来越重要的时代,存储要自立门户是必然的事。
如果我们把存储当作一个独立的主机来看,理解起来就很简单了。我们说到LUN的概念的时候,我们就要将分为两个层面。一个层面就是在阵列这个机器的os识别到的范围,一个层面就是服务器的os识别到的范围。这两个层面是相对独立的,因为如果我们把存储当作一个主机来看,那么它自然有自己的device,target,LUN之说,而服务器也有自己的device,target,LUN之说;另外一方面,这两个层面又是相互关联的,一个阵列的控制系统,大多都有虚拟化的功能,阵列想让主机看到什么样的东西,主机才能看到相应的东西。当然,服务器识别到的最小的存储资源,就是LUN级别的。那么主机的HBA卡看到的存储上的存储资源就靠主要两个东西来定位,一个就是存储系统的控制器(target),一个就是LUN ID,这个LUN是由存储的控制系统给定的,是存储系统的某部分存储资源。
LUN的multi-path
现在,存储网络越来越发达了,一个LUN有多条通路可以访问也不是新鲜事了。
服务器使用多个HBA连接到存储网络,存储网络又可能是由多个交换设备组成,而存储系统又可能有多个控制器和链路,LUN到服务器的存储网络链路又可能存在着多条不同的逻辑链路。那么,必然的,同一个physical LUN在服务器上必然被识别为多个设备。因为os区别设备无非用的是总线,target ID,LUN ID来,只要号码不同,就认为是不同的设备。
由于上面的情况,多路径管理软件应运而生了,比如emc的powerpath,这个软件的作用就是让操作系统知道那些操作系统识别到LUN实际上是一个真正的physical LUN,具体的做法,就是生成一个特别的设备文件,操作系统操作这个特殊的设备文件。而我们知道,设备文件+driver+firmware的一个作用,就是告诉操作系统该怎么使用这个设备。那么就是说,多路径管理软件从driver和设备文件着手,告诉了操作系统怎么来处理这些身份复杂的LUN。
LUN masking,LUN mapping
我们有了独立的磁盘阵列用了之后,服务器只要看到存储的控制系统,就有可能使用磁盘阵列的磁盘资源,但是磁盘阵列不可能只为某一个服务器来使用,所以他必须管制主机使用某部分磁盘资源。这个管制分为两个部分:一部分就是LUN mapping,类似于绿色通道,就是保证服务器能看到某部分存储资源,一部分就是LUN masking,类似于警戒线,就是保证服务器只可访问给它分配的存储资源,而没分配给服务器的资源,就不要染指了。
实现LUN masking和LUN mapping有三种方法:一个是基于存储控制系统来设置,一个是基于存储交换系统来设置,一个是基于服务器os来设置。
基于存储控制系统得设置,是比较常见的设置,比如很多磁盘阵列的控制系统,本身就能设置LUN被某服务器看到。比如FastT的partition功能。
基于存储交换系统的设置,也是一种常用的方法,比如常说的zoning。
基于服务器os的设置,比较少采用,一般采用安装某些操作系统上安装某些软件来实现,因为这个方法全靠服务器自觉,所以比较少用。
RAID磁盘数据恢复可能针对的不是一种情况,有时候是RAID信息和硬件故障、单块硬盘故障都有参与的复合型故障,所以具体问题需要具体分析。如果是比较重要的文件,建议停止任何尝试性操作,以免情况更糟,立即寻求专业数据恢复公司进行数据恢复。