提要:EMC2公司的远程数据镜像技术(SRDF),实现了数据在不同环境间的实时有效复制,而无论这些环境间相距几米、几公里,还是横亘大陆。SRDF产品最早在1994年10月就开始进入市场,目前已成功地应用于超过2800个重要的系统和各种操作系统环境中。本文首先简要回顾企业的数据持续可用性所面临的挑战,然后就SRDF基本工作原理和实现方案做一简单介绍。
当今的企业业务24小时都离不开数据。如果由于维护、内部调整、系统升级,或者是自然灾害或人为故障,造成了重要业务数据无法访问,给企业造成的损失将是惨重的--有时甚至直接关系到企业的存亡。所以,90年代现代化企业所使用的高可用性计算机系统,最重要的是确保企业业务数据的完整和持续可用。
挑战
保持企业数据持续可用性面临来自多方面的挑战,最主要的有:自然灾害或人为故障、数据中心迁移、软、硬件系统变更或升级等。多年以来,为确保关键任务型系统的高可用性及其所处理数据的持续可用性,人们想出了很多解决方案--比如镜像或备份等等。
就传统镜像方案来说,各种制约因素致使主服务器与存储系统往往同处一地。这种情况下,如果服务器中某一台发生软件、硬件故障,存储系统快速恢复服务往往是可行的。但是如果发生自然灾害(水灾、火灾和地震等)影响到整个数据中心,我们就无法保证所有主服务器和存储系统都是可用的了。
我们再来考查传统备份方案。这类方案大多使用磁带机和磁带进行数据备份。完成备份后的磁带被存放到一个相对比较独立的磁带库中。为保证备份数据不受数据中心现场所发生的意外事故影响,我们通常将磁带库安排在远离数据中心的地点。这种方案虽然能够确保数据的安全,但却存在着较严重的"数据滞后"现象。一般来说,由于磁带机较低的工作效率和传统运输方式等影响,这种备份方案会给我们带来至少30小时的数据滞后--也就是说当事故发生时,我们向系统恢复的数据起码是30小时之前的旧数据了。很明显,对于当前企业任务关键型应用来说,这种滞后是难以忍受的。
进入90年代后,磁盘阵列技术发展十分迅速--比较有代表性的就有EMC2的Symmetrix等。随着技术的发展,磁盘阵列技术正在将磁盘镜像功能和处理器负荷从处理器转移到智能磁盘控制器上,这种技术不但保证了我们能够做到在灾难发生的同时实现应用处理过程的实时恢复,而且解决了在数据恢复过程中一直困扰人们的费时费力的磁带倒带操作。此外,通信技术的发展使异地间高速数据交换成为了可能。现在,恢复一个系统可能仅需几分钟,而不再是传统方式下的数十个小时了。 所有这些,正是EMC2提出Symmetrix远程数据镜像(SRDF)的技术背景。
SRDF的技术演变和原理
SRDF是在Symmetrix成功经验的基础上,通过对磁盘子系统的性能不断改进而产生的。1994年,EMC通过实现一种独特的远程镜像技术而使向前跨跃了一大步。新的技术不仅把本地镜像磁盘(M1,M2)安置在源磁盘的系统中,而且还移到第二个子系统中,并通过ESCON光纤电缆实现与两台Symmetrix连接。就数据存储的实际效果而言远程镜像与本地镜像效果是一样的。这就是EMC2领先的SRDF(Symmetrix远程数据镜像)。
SRDF拥有两套磁盘子系统,我们分别称之为R1和R2,存放实时数据拷贝的R2子系统被安置在与存放原始数据拷贝的R1子系统不同的地点。这样就确保了在数据中心发生故障时,R2系统仍然是可用的,而且与R1是同步的。由于使用了不同的子系统,所以可对R1和R2分别进行寻址。第二个数据拷贝(R2)可以按照只读模式供附加在第二个子系统上的第二个处理器使用。总的来说,SRDF基本上就是存储控制器上的RAID-1实现,只不过这时磁盘子系统被分为本地(R1)和远程(R2)两个部分,任何写入R1的数据都会同时被自动复制到R2之上。
SRDF适用环境
与EMC2的Symmetrix一样,SRDF的工作是独立于操作系统的,任何支持Symmetrix的主机环境,同样支持SRDF。包括IBM、IBM兼容主机,AS/400、SUN、HP、NCR、RS6000、DEC、SGI、BULL、UNISYS、SIEMENS、ICL等,都是SRDF典型的应用环境。
尽管SRDF的镜像功能没有使用任何主机资源,但是在特定环境中,可以先用一个被称作SRDF HOST COMPONENT主机部件的设备对SRDF进行管理。SRDF主机部件主要用于:
.查询SRDF关系状态(驱动器、链路)
.查询每对驱动器的同步状态(同步、失去同步或失去同步的磁道数)
.修改每对逻辑驱动器的重新同步选项(同步、半同步、自适应拷贝、多米诺、无效磁道)
.针对每对驱动器或整个SRDF子系统的镜像处理发布"暂停"、"恢复"命令。
主机部件命令可以集成在系统的自动运行过程中,这就为用户提供了一种稳定良好的远程镜像实现方案,并且具有很大在的灵活性和可控制性。
SRDF实现方案
SRDF包括:
.2套或多套Symmetrix系统
.远程链路适配器(Remote Link Director )
.每个Symmetrix的SRDF微码许可证
.Symmetrix间的链路(ESCON光纤、电信线路、ATM、FDDI)
.控制进程及其处理
园区解决方案
连接Symmetrix 的ESCON光纤最长不超过66公里。在3公里内,可采用多模光纤直接与远程链路适配器连接。如果场地之间的距离超过3公里,则可采用标准ESCON通道和扩展器,它们相互之间的连接距离应在30公里以内,总的连接距离不超过66公里。中间的连接电缆可以是Dark光缆或单模光纤。此外,EMC2的9191设备可以用于:
.为SRDF客户在整个园区内提供ESCON模式变换
.支持多模到单模的变换和单模到单模的信号再生
.以全ESCON速度运行SRDF
.相距30公里的Symmetrix源系统与目标系统。如果客户的连接距离超过这个范围,可以使用3个9191设备将这个距离扩展到66公里。
扩展距离解决方案
在这种情况下,远程链路适配器(RLA)仍然采用ESCON连接,但系统连接采用高速专线替代了ESCON扩展器,典型的连接链路是T3/E3, T1/E1,ATM,FDDI,高速专线在两端与ESCON光缆的界面则需要采用一对由General Signal Networks、 Computer Networks Technology或, Networks System Corporation 生产的协议变换单元。
初始同步
一旦物理连接建立起来,用户确定了哪些逻辑设备需要远程镜像之后,并就开始启动指定设备的同步处理,同时R1设备数据向R2设备进行拷贝。在初始同步过程中,可将应用I/O指定给R1单元,表示该应用I/O在数据同步过程中要优先处理。最后所有设备都进入同步状态(也称为稳定状态),连接链路就只需传送有变化的数据了。
SRDF运行模式
SRDF在指定磁盘卷的同步方式上十分灵活,SRDF基本运行模式可分为同步和半同步两种,此外还有其它一些工作模式作为基本模式的补充。
同步模式
在向远程镜像磁盘卷中写入数据时,同步模式下的数据处理过程如下:
.数据被写到本地Symmetrix的缓存中
.将一个输入项置于SRDF更新数据的FIFO队列中
.第一个可用的RLA从队列中提取第一个输入项,并通过链路将其送到远程Symmetrix的缓存
.远程Symmetrix发送数据接收确认信号
.修改磁道表
.向发出请求的主机发回设备结束信号
在同步模式下,如果某个盘卷已经启动了写操作,则所有该盘卷以后的读写访问都将被放到队列中等待,直到该写操作被远程确认。
半同步模式
在向远程镜像磁盘卷中写数据的时候,半同步模式下的数据处理过程如下:
.数据被写到本地Symmetrix的缓存中
.将一个输入项置到SRDF更新数据的FIFO队列
.向发出请求的主机发回设备结束信号
.第一个可用的RLA从队列中提取一个数据项,并通过链路将其送往远程Symmetrix的缓存
.远程Symmetrix发送数据接收确认信号
.修改磁道表
在半同步模式下,在写操作向远程发送数据的过程中,允许进行读访问。但下一个写操作必须在前一个写操作数据安全完成远程处理后进行。因此一个R2磁盘卷最多滞后它的R1一个写操作。由于提前向主机发出了"设备结束"信号,可能会出现这样的情况,即操作系统和数据库管理系统在下一个写操作中要求将数据写在另一个磁盘卷,而后者在逻辑上与第一卷的写操作有关。但实际上这没有什么问题,因为SRDF采用的是FIFO(先进先出)队列,要写入的数据在SRDF队列中是按适当的顺序排列的,可以确保数据拷贝正确顺序。
除同步、半同步运行模式外,SRDF还有多种补充运行模式,它们分别是自适应拷贝、全局多米诺模式、链路多米诺模式以及无效磁道方式等。
结语
从以上关于EMC2 SRDF远程数据镜像技术的讨论我们不难看出,SRDF不仅仅是提供了最佳的业务持续性、高可用性的灾难恢复解决方案,而且还可以增强用户建立恢复方案的信心。
特别推荐:《流星花园》铃声图片专辑
点一支歌送朋友,带给他(她)春天的信息和你的心意!
|