建设灾备中心保障企业信息化探讨

时间:2022-01-05 16:15:04

导语:建设灾备中心保障企业信息化探讨一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

建设灾备中心保障企业信息化探讨

摘要:随着云计算、大数据、人工智能等新一代信息技术快速发展,给企业信息化发展插上了翅膀。我们正处在一个信息数据爆炸性增长的大数据时代,数据的存储方式由分散在各个服务器硬盘转变为集中的存储资源池。各种信息数据给企业带来不菲价值的同时,信息数据缺失带来的影响也随之而来,容灾备份突显出其重要性。该文在容灾备份概述、容灾级别和容灾备份技术介绍的基础上,描述灾备中心系统架构和建设策略,指出应根据实际情况针对性地建设灾备中心,最大程度的保障企业信息化

关键词:容灾备份;灾备中心;建设策略

现在是信息化时代,信息数据成为各行各业的基础和命脉,信息数据的缺失将影响业务系统的正常运行,导致企业的生产经营受到重大影响。传统的数据备份模式将数据备份至本地存储资源池,避免个人因素、服务器硬盘故障、操作系统中毒等原因造成的数据缺失,但对于自然灾害造成的损毁则无法挽救。当下虚拟化和云计算的业务系统有更高的响应要求,传统的数据备份模式无法满足新时代的RTO和RPO需求。从战略角度研究如何建设灾备中心保障企业信息化显得尤为重要。

1容灾备份概述

1.1容灾备份的含义

容灾指在物理上间隔开的两处或多处场所,各自建设一套完整的业务系统。业务系统可以切换至任意一处场所,各处业务系统互相检测对方运行状态。当自然灾害导致某一处场所业务系统无法运行时,另外一处场所业务系统可以及时接管,保证业务系统稳定、安全运行。单从目的出发,所有为了保障业务系统可用性做出的工作都称之为容灾。备份指对信息数据、操作系统的额外复制。避免个人因素、服务器硬盘故障、操作系统中毒等原因造成的数据缺失,从服务器硬盘、存储资源池中手工拷贝或使用备份软件将数据复制到其他存储介质的过程。完整备份、增量备份、差异备份都是备份的不同模式。备份和容灾是存储领域两个极其重要的部分,备份是信息数据可用性的最后一道防线,是容灾的根本和基础;容灾是达成应用高可用性的手段之一[1]。

1.2容灾级别

根据应对突发灾难时,容灾所给出的不同程度的应急解决方案,可以区分为数据级容灾、应用级容灾和业务级容灾。1.2.1数据级容灾数据级容灾,顾名思义就是针对数据本身层面的容灾。当发生灾难时,数据容灾可以及时恢复信息数据,保证数据完整性。但数据容灾仅仅保护信息数据,如果灾难发生时业务系统也遭受损坏,恢复的信息数据也无法使用。1.2.2应用级容灾应用级容灾在数据级容灾的基础上,对业务系统也进行容灾。在灾备环境中搭建一套同样的业务系统,保持与运行的业务系统数据同步传输。当发生灾难时,信息数据和业务系统同时快速切换至灾备环境的业务系统,保证业务系统运行连续性。应用级容灾可以让业务系统随时切换运行场所,保证业务系统始终都在线,不受外界环境的变化影响。1.2.3业务级容灾除了保证信息数据、业务系统在灾备环境可用之外,还要保障整个企业的业务仍对外服务,这里面就包含了业务服务可用,管理部门可用、业务生产部门可用、对外服务部门可用等,这是最终层次的容灾[2]。信息化时代高速发展,对业务系统提出了更高的“四不原则”:业务不停、网络不断、系统不瘫、数据不丢[3],这一核心理念在业务系统安全生产过程中起到了非常重要的指导作用。

2容灾备份的技术

2.1数据备份技术

数据备份是容灾备份的基础工作,为了防止个人因素、硬盘故障、系统中毒等原因造成的数据缺失,从硬盘、存储资源池将数据复制到其他存储介质的过程。传统的数据备份通常采用磁带库进行冷备份,随着网络带宽发展,数据备份采用了数据备份管理软件结合备份存储设备实时在线运行。

2.2远程复制技术

通过远程复制技术,来实现数据中心和灾备中心之间的数据传输,保证数据传输的一致性、可靠性。将数据中心产生的数据源源不断的复制到灾备中心,保证灾难发生时业务系统恢复的数据损失最小化。

2.3实时检测技术

当灾难发生,如何尽早发现业务系统不可用,如何尽快将业务系统切换到灾备环境,都可以让灾难带来的损失降到最低。除了人工发现灾难到来时手动切换业务系统,业务系统如何能自动检测异常情况发生,自动切换成为关键。目前检测技术一般采用心跳技术,即在数据中心和容灾中心设定定期广播机制,数据中心每隔一段时间向容灾中心发送信号,表示自己处于正常运行状态。当容灾中心在设定的最大容忍时间内都没有收到信号时,容灾中心便认为数据中心出现异常,采取接管行动。

3灾备中心的系统架构

容灾中心的系统架构规划,结合地域、功能的不同划分为:本地备份、异地热备、异地互备。

3.1本地备份

数据仅仅在本地存储设备做了备份保存,并没有在异地单独建设一个灾备中心,如果遇到灾难情况比较严重,本地备份难以实现数据恢复。

3.2异地热备

在异地独立建设一个灾备中心,灾备中心与数据中心数据传输通过网络专线进行。在日常业务系统正常运行情况下,灾备中心仅仅只是备份数据,不涉及业务系统运行。如果数据中心通信发生异常,灾备中心及时响应并接管业务系统运行,保证业务系统正常运行的连续性[4]。

3.3异地互备

在与数据中心有一定物理距离的异地建设另外一个数据中心。业务系统在日常情况下随机运行在一个数据中心,另外一个静默同步数据。在遇到突发灾难时,两个数据中心可以根据自身情况相互接管业务系统。

4灾备中心的建设策略

灾备中心的建设策略,应全盘考虑企业成长结合不同时期的业务需求。创业伊始,企业的业务系统还刚刚起步,完全可以依照数据级容灾的要求对关键信息数据进行备份;到了成长阶段,企业的发展伴依托业务系统信息化快速成长,这个时候需要选择应用级容灾来保障企业成长需要;来到稳定发展阶段,企业经过高速的发展,业务系统伴随着企业规模不断扩展。这个时候就可以考虑选择同城双活或者两地三中心的容灾备份方案,确保企业发展的信息数据不丢失,业务系统安全、稳定地运行。在当今以服务为导向和以客户为中心的业务环境下,保障灾备中心的正常运行对数据中心具有重大意义[5]。

4.1本地数据备份

当数据中心正常运行时,将业务系统不间断运行的过程中产生的数据实时或定期备份到除本地存储之外的备份存储。如果硬件设备允许,可以同时归档到磁带库保存。

4.2双活数据中心

在数据中心之外,再独立建设一个灾备中心,灾备中心与数据中心通过网络通信进行数据备份传输。在业务系统正常运行情况下,灾备中心只备份数据,不涉及业务系统运行,但可以对外提供信息数据读取服务。如果数据中心通信发生异常,灾备中心及时响应并接管业务系统运行,保证业务系统正常运行的连续性。

4.3两地三中心

在双活业务中心的架构基础之上,在异地建设一个独立的灾备中心。不同于其他容灾方案,两地三中心的容灾依靠资源组的状态来判断是否需要进行业务接管切换。资源组的状态一共有三种,分别为online、offline、fault。在online或者offline的状态下,资源组都能够按照既定的方案运行脚本和程序,保障业务系统始终在线运行。数据中心正常运行时,其资源组的状态显示为online,其他两个灾备中心的资源组状态为offline。当数据中心的资源组出现fault状态时,资源组判断灾难已经发生,同时进行业务系统切换,从而保障了业务的连续性。

4.4灾备中心的容灾指标

在大数据时代,企业对业务的连续性有严苛的要求,但有些天灾人祸和人为故障难以避免,一旦发生意外就需要启用灾备方案,保障业务系统的连续性。RPO和RTO可以很好地反映出企业系统的容灾性能如何。这两个指标值的高低,直接反映了当前系统数据在灾难恢复方面的能力。4.4.1RPO(RecoveryPointObject)恢复点目标当灾难发生时,备份的数据能够恢复到具体哪个时间节点,在这个时间节点之后到灾难发生时的数据则丢失了,体现业务系统能承受的最大数据缺失时间段。比如定时备份在每天0点进行,设置的业务系统RPO为12小时。如果早上8点发生灾难,最大数据缺失时间就是8个小时,没有超过RPO规定时间并无大碍;如果晚上8点发生灾难,最大数据缺失时间就是20个小时,大大超过RPO规定时间,那么会导致业务系统受到影响以致造成损失。4.4.2RTO(RecoveryTimeObjective)恢复时间目标当灾难发生时,业务系统容忍停止运行的最长时间,也就是灾难发生到业务系统恢复运行功能所需要的最短时间。如果业务系统设定灾难发生的6个小时内必须恢复,那么RTO就是6小时。这意味着能容忍业务系统停止运行的时间为6小时,即虽然业务系统在这6小时内不能运行,但业务可以正常维持进行。如果业务系统在6小时后仍不能恢复运行,那么业务可能会遭受无法弥补的损失。

4.5完备的灾备中心设计

首先区分同城灾备中心和异地灾备中心的功能和差异,数据中心与同城灾备中心的距离比较近,通信线路质量较好,比较容易实现数据的快速恢复,保证数据完整性和数据零丢失。而异地灾备中心与数据中心之间的距离较远,异地灾备中心不仅可以防范区域性灾难时够保障关键业务的安全性,做到数据不丢失,还能够防范战争、地震、水灾等风险。而两地三中心比同城灾备中心多了一个异地数据中心。这个异地数据中心主要用于规避大自然灾害发生时,异地的数据中心能够立即启动,保障业务和数据最大限度不受影响,仍能够正常运行[6]。其次建设前期应该特别关注,业务系统对业务的重要性决定了容灾级别是数据级还是应用级;业务系统的硬件性能高低决定了灾备中心的设备选型;业务对RTO/RPO的要求决定了容灾备份是同步备份数据还是异步备份数据;生产存储的数据大小和增长快慢,决定了灾备中心容灾存储的选择。

5结束语

当前自然灾害频发、网络攻击越来越严重的背景下,尽快建设灾备中心的任务迫在眉睫。如何建设灾备中心是一项缜密细致的工程,我们应该从业务系统建设情况出发,结合企业自身发展情况进行科学有效的规划和建设,保证灾备管理程序严格执行,让灾备中心真正地发挥作用,为信息化领域的关键业务和业务系统安全保驾护航。

参考文献:

[1]林小村.马玉林.翁小云.数据中心建设与运行管理[M].北京:科学出版社,2010.

[2]张冬.大话存储[M].北京:清华大学出版社,2008.

[3]赵晟华.数据中心运维服务管理与呼叫中心整合的有关技术分析[J].中国信息化,2020(7):58-59.

[4]狄广义.数据中心灾备系统建设研究[J].通讯世界,2017(23):47-49.

[5]顾大伟,郭建兵,黄伟.数据中心建设与管理指南[M].北京:电子工业出版社,2010.

[6]吴莹.两地三中心容灾备份系统建设及成效[J].金融科技时代,2016,24(5):23-27.

作者:许上鉴 单位:上海核工程研究设计院有限公司