灾备
灾备即灾难备援,它是指利用科学的技术手段和方法,提前建立系统化的数据应急方式,以应对灾难的发生,包括数据备份和系统备份,业务连续规划、人员架构、通信保障、危机公关,灾难恢复规划、灾难恢复预案、业务恢复预案、紧急事件响应、第三方合作机构和供应链危机管理等等。
灾备等级
根据恢复的目标与需要的成本投入,灾备大体可以分为三个等级,如图-1可以用三个嵌套的同心圆表示,从数据级灾备、应用级灾备到业务级灾备,业务恢复等级逐步提高,而需要的投资费用也相应增长。
数据级灾备强调数据的备份和恢复,包括数据的复制、备份、恢复等在内的数据级灾备是所有灾备工作的基础。
应用级灾备强调应用的具体功能接管,它提供比数据级灾备更高级别的业务恢复能力,同时也是业务级灾备的基础,只有具体应用得到恢复,后续的业务才能有效进行。
业务级灾备是最高级别的灾备建设,如果说数据级灾备、应用级灾备都是在IT系统的范畴之内,业务级灾备则是在以上两个等级的灾备基础上,还需考虑到IT系统之外的业务因素,包括备用办公场所、办公人员等,而且业务级灾备通常对支持业务的IT系统会有更高的要求(RTO在分钟级)。
灾难恢复衡量指标
RTO(Recovery TimeObjective)恢复时间目标
指所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期,而且RTO针对的是造成中断的事件,并不一定是灾难事件。RTO值越小就意味着所要求的恢复能力越强。
RPO(Recovery PointObjective)恢复点目标
指的是业务系统所能容忍的数据丢失量。如果RPO等于零,就意味着要求数据零丢失。否则为了恢复业务处理,就需要对丢失数据进行修复或追补。
RTO针对的是服务丢失,RPO针对的是数据丢失,二者没有必然的关联性。RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定,对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。
APIT(Any Poit InTime)任意时间点回退
在数据发生逻辑错误时,我们需要对破坏的数据进行恢复,这时CDP持续数据保护技术的衡量标准可以用APIT值进行评判。
NRO(NetworkRecovery Objective)网络恢复目标
是指在灾难发生后切换到灾备中心所需的时间。在这一预定时间内不仅要求将网络连接从数据中心切换到灾备中心,还要使用户的网络访问能够成功地转移到灾备中心。
灾备能力等级要求
关于灾难恢复等级的国家标准具体叙述。《信息安全技术信息系统灾难恢复规范》国家标准(GB/T20988-2007)是我国灾难备份与恢复行业的第一个国家标准。该标准由国务院信息化工作办公室领导编制的,并于2007年11月1日开始正式实施。该标准规定了信息系统灾难恢复应遵循的基本要求,适用于信息系统灾难恢复的规划、审批、实施和管理,并参照国际标准SHARE78的7个层级定义,确定了符合中国国情的6个灾备能力等级要求。
生产系统
是指在正常情况下支持单位日常业务运作的信息系统。灾备领域对生成系统进行容灾,包括各企业的特定系统,以及通用的ERP、OA、CRM、财务系统等。
数据存储
数据以某种格式记录在计算机内部或外部存储介质上的过程称为数据存储,数据存储对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。从定义上,存储和灾备并不属于同一领域,但灾备技术的发展依托于存储技术的发展。常见的存储方式主要包括:DAS直接附加存储、SAN存储区域网络、NAS网络附加存储、OBS对象存储等。
数据迁移
是一种将离线存储与在线存储融合的技术。它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的 数据按指定的策略自动迁移到磁带库、磁盘等二级大容量存储设备上。
容灾备份
容灾备份实际上是两个概念,容灾是为了在遭遇灾害时能保证信息系统能正常运行,帮助企业实现业务连续性的目标,备份是为了应对灾难来临时造成的数据丢失问题。
数据备份
数据备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它存储介质的过程。按照备份数据量,可以分为:全量备份、增量备份、差量备份;按照备份时间频率,可以分为定时备份和实时备份。
双机热备
指基于高可用系统中的两台服务器的热备(或高可用),因两机高可用在国内使用较多,故得名双机热备,双机高可用按工作中的切换方式分为:主-备方式(Active-Standby方式)和双主机方式(Active-Active方式),主-备方式即指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。而双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态)。
双机冷备
双机冷备技术,可以实现数据的定时自动同步,在2台服务器运行的时候,自动将数据定时同步到另一台服务器。当正在提供服务的这台服务器出现故障后,可以人工手动切换到另一台服务器,保障系统的连续运行和服务。
脑裂
在“双机热备”高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障,2个节点上的HA软件像“裂脑人”一样,“本能”地争抢“共享资源”、争起“应用服务”,就会发生严重后果:或者共享资源被瓜分、两边“服务”都起不来了;或者两边“服务”都起来了,但同时读写“共享存储”,导致数据损坏(常见如数据库轮询着的联机日志出错)。
业务连续性
业务连续性是指在中断事件发生后,组织在预先确定的可接受的水平上连续交付产品或提供服务的能力。它明确一个机构的关键职能以及可能对这些职能构成的威胁,并据此采取相应的技术手段,制定计划和流程,确保这些关键职能在任何环境下都能持续发挥作用
高可用
指的是通过技术手段,尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。
字节级复制
指以旁路监听作为数据捕获的方式,以字节级增量作为数据传输最小基准单位,将生产端变化的数据复制到灾备中心并将变化的数据实时地传输到任意距离外的灾备站点。
CDP
CDP实时备份,指持续数据保护技术。
同步复制
在主/备中心的磁盘阵列同步进行数据的更新,应用系统的I/O写入主磁盘阵列后,主磁盘阵列将利用自身的机制,同时将写I/O写入后备磁盘阵列,后备磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。
异步复制
在应用系统的I/O写入主磁盘阵列后,主磁盘阵列立即返回给主机应用系统“写完成”信息,主机应用可以继续进行读、写I/O操作。同时,主中心磁盘阵列将利用自身的机制将写I/O写入后备磁盘阵列,实现数据保护。
镜像(复制)
镜是一个复制的动作,像是一种结果。镜像按主机的写入是否需要远程镜像站点的确认信息,又可分为:同步远程镜像和异步远程镜像。
同步远程镜像(同步复制技术)——是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。同步镜像使远程拷贝总能与本地机要求复制的内容相匹配。
异步远程镜像(异步复制技术)——保证在更新远程存储视图前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息。
快照技术
快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。从具体的技术细节来讲,快照是指向保存在存储设备中的数据的引用标记或指针。换句话说,快照类似详细的目录表,但它被计算机作为完整的数据备份来对待。
切换技术
切换(Failover)技术是指在早前运行系统故障或异常终止后,能够自动(通常无需人工干预或警告)切换到冗余或备用信息系统的能力。根据具体突发故障的不同,又可以归类为网络切换和应用切换。灾备切换是一系列操作的组合,不是单一的技术动作,并且由于“容灾黑盒”的存在,其切换的决策难度非常大。
主备集群远程技术
是指通过在生产中心和灾备中心的应用服务器上安装远程集群软件,实现跨广域的多服务器状态的监控,当发生灾难时,实现应用服务器的自动切换。
双活负载均衡技术
归类到应用切换功能,双活技术是一种利用IT资源较多的灾备方案,来源于多中心技术。真正意义的双活指两个数据中心同时处于生产状态,类似于负载均衡技术,但通常的负载均衡针对于业务流量而非数据保护和数据安全,启用所有资源共同承载业务的服务,同时保证了当其中一边发生灾害事件时,另一方的资源可直接接管所有的业务服务
双活容灾
双活容灾即灾备系统中使主生产端数据库和备机端数据库同时在线运行,处于可读可查询的状态的技术。
重复数据删除技术
基于磁盘的重复数据删除技术已经被大量应用于灾备存储中,该项技术通过寻找不同数据块中的冗余数据,并通过删除这些重复的数据来对数据进行压缩,某些重复数据压缩技术甚至实现了20:1的压缩比,通过重复数据删除技术不但能解决单数据中心多副本占用空间的问题,还可以减少传输备份数据所需要的带宽。
两地三中心
指往往采用“同城灾备+异地灾备”的两地三中心整体灾难恢复解决方案,可以满足不同灾难场景下的业务连续性要求。同城灾备中心主要是用于防范生产中心机房或楼宇发生的灾难,异地灾备中心用于防范大规模区域性灾难。
异地容灾
是指在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用。异地容灾对企业应用及数据库起到了安全性、业务连续性等方面的作用,因此它与私有云或者公共云起到的容灾结果是完全不同的。
灾备一体机
是一款将备份软件、备份服务器以及磁盘(存储介质)整合到一个架构中而形成的一个设备,最终用户可以像操作备份软件一样来操作这个设备。
指将本地或云端数据备份到新的云存储平台。
云灾备
灾备TCO
灾备规划建设从产品采购到后期使用、维护的总的成本。
IP漂移
一般情况下,两台服务器都具有一块以上的网卡,每块网卡都应该有一个IP地址,同时,还应该有一个漂移IP地址,该地址为工作IP地址。因此,最简单的主从方式下,双机系统要占用3个网络地址。在分配IP地址时,要分清工作IP地址和主机自由地址。如在主从方式、单网卡的情况下,主机一地址为200.10.10.1,主机二的地址为200.10.10.2,工作地址为200.10.10.3,正常情况下,工作主机的自由地址是被工作地址取代的(若主机一在工作,主机一的地址由200.10.10.1变为200.10.10.3)。在发生主机切换的情况下,主机一的地址恢复为200.10.10.1,而主机二的地址会由200.10.10.2变为200.10.10.3,这就是IP地址漂移。
及时响应,快速服务,为您保驾续航
立即注册