-
灾备与业务连续性
灾备备份
谈容灾先要搞清楚灾难备份的含义。灾难备份,简称灾备,就是指利用技术、管理手段以及相关资源确保关键数据、关键系统和关键业务在灾难发生后可以尽可能多且快地恢复的过程。灾备的目的是确保关键业务持续运行以及减少非计划宕机时间。灾难备份可以分为狭义和广义两类,前者主要指灾难备份系统,后者又加入了一层灾难恢复的含义。容灾可以说就是广义上的灾难备份。
容灾是基于容错技术的,是容错技术的重要分支。容错技术的研究与发展应该以1971年召开第一届国际容错计算会议(FTCS-1)为起点。“容错”当然不是指“容易错”,而是指“容许错”,更确切些说应该是“容许故障”。在信息领域,容灾系统可以理解为是以存储系统作为基本支撑、以网络作为基本传输手段、以容错软硬件技术为直接技术手段、以管理技术为重要辅助手段的综合系统。现在的容灾技术可以说涵盖了容错、信息安全和系统管理三大领域。
容灾的级别
在容灾领域,国内和国际均有分级的定义标准,国际标准我们称为Share78,而国内标准则是2007年11月正式实施的《信息系统灾难恢复规范》。国内的标准出台相较国际标准要晚上15年,国内标准的基本分级原则和Share78相同,只是少了一个级别。
国际标准中容灾方案的技术层次 根据国际标准 Share78 的定义,容灾方案被分成了 7 个级别,这 7 个级别也就是我们最常提到的国际容灾 7 标(层)。
目前针对这7个层次,都有相应的容灾方案,所以用户在选择容灾方案时应重点区分它们各自的特点和适用范围,结合自己对容灾系统的要求判断选择哪个层次的方案。
联系我们
电话:
|
021-6173-5936
|
地址:
|
上海市浦锦路2049弄万科VMO
花园广场38栋6楼
|
表1:国际容灾级别对比
一些系统厂商在国际/国内标准的基础上,又提出了自己的个性化分级方式。比如IBM就将灾难备份分成了热备份(对应最高的Tier7也即是国标中的第6级)、温备份(基本对应Tier5和Tier6)、冷备份(中等重要程度应用灾难备份方案,对应Tier3和Tier4)和无应用备份(数据磁带远程传送方案,对应Tier1和Tier2,是最基本的磁带备份解决方案)。 GHO 包是不是容灾技术? GHO包只是做了简单的本地磁盘不同分区或相同系统上不同磁盘的数据备份,只能算是数据备份,称不上容灾系统。同样的,数据库复制技术本身也谈不上容灾。真正的容灾必须满足3个要素:先是系统中的部件、数据都具有冗余性,即一个系统发生故障,另一个系统能够保持数据传送的顺畅;其次,具有长距离性,因为灾难总是在一定范围内发生,因而足够的距离才能够保证所有数据中心不会被一个灾难全部破坏;第三,容灾系统要追求全方位的数据复制,也称为容灾的“3R”(Redundance、Remote、Replication)。
容灾重点指标
在企业构建容灾系统时,有两个至关重要的指标,这就是RPO和RTO。这两个指标的高低,决定了企业需要建立的容灾系统的级别。从前文的表格中我们不难看出,不同容灾方案的RTO和RPO是不相同的。 RPO
RPO可简单地描述为企业能容忍的最大数据丢失量,它是反映恢复数据完整性的指标。在同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。
|
在实际应用中,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性(SCN)是不相同的,RPO表示业务数据库与容灾备份数据库的SCN的时间差。发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。
|
|
|
RTO TO可简单地描述为企业能容忍的恢复时间,它是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金。在RTO中,还有一个比较重要的时间段,我们称之为网络恢复时间(NRO)。
名词解释
-
灾难(Disaster)
由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定时间的突发性事件。通常导致信息系统需要切换到灾难备份中心运行。
-
灾难恢复(Disaster Recovery)
为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。
-
灾难恢复规划DRP(Disaster Recovery Planning)
为了减少灾难带来的损失和保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作所做的事前计划和安排。
-
灾难备份中心(Backup Center for Disaster Recovery)/备用站点(Alter-nate Site)
用于灾难发生后接替主系统进行数据处理和支持关键业务功能运作的场所,可提供灾难备份系统、备用的基础设施和技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。
什么是同步和异步?
同步方式是指主/备中心磁盘阵列同步地进行数据更新。前端应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列将利用自身的机制同时将I/O写入后备磁盘阵列;后备磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。
异步方式是指应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列立即向前端应用系统返回“写完成”信息,主机应用可以继续进行I/O操作。同时,主中心磁盘阵列将利用自身的机制将I/O写入后备磁盘阵列,实现数据保护。