高可用灾备方案 才能维持业务持续运营

来源:赛迪网  作者:施建忠、高勇
2011/3/22 8:50:08
在过去的30-40年间,灾备服务体系本身在不断的自我完善:从最初的仅仅面向数据,面向IT系统,面向单一自然灾害,逐渐转向面向业务、面向合作伙伴、面向整个供应链。现在,越来越多的企业CIO青睐于选择灾备外包模式——在业内人士看来,由灾备自建到灾备外包,是企业灾备管理意识的自我觉醒和自我提升。

本文关键字: 灾备方案 业务运营

责任机制

自建模式下,大部分企业是由同一个部门承担生产中心和灾备中心的运行责任,在管理机制上灾备中心的运行队伍并不是面向生产中心负有服务责任,其工作责任主要靠岗位职责和绩效考核。外包模式下,灾备中心由专业公司负责运维,对企业的生产中心承担服务责任,并且有相关的服务赔偿条款,相关责任和义务更为明确。

建设、运营效率

自建灾备中心工程浩大,已远远超出企业IT部门和企业自身管理范畴,而且牵扯电力、市政、土建等多个政府职能部门,因此,建设周期通常为12-24个月。外包模式由第三方服务商提供现成的灾备中心资源,大大缩短了项目周期,使企业在3-6个月就可获得相应的灾难恢复能力。

风险及实践经验

第三方服务提供商拥有完善的灾难恢复服务体系和方法论,专业的技术和运营管理团队,丰富的运营、管理、服务经验,可以让企业直接分享服务提供商的最佳成功实践。

核心竞争力提升

灾备中心建设和灾备运营、管理仅是业务持续运行的支持、保障手段,并不能直接创造营业额,因此,采用外包模式可以帮助企业在基础设施建设、运维管理、人力资源投入等方面节约的同时,使企业能够集中更多的人力、财力、物力等资源,专注于核心竞争力的提升。

需要特别强调的是,目前灾备服务市场的服务提供商水平还良莠不齐,差强人意,企业需要选择服务经验、服务能力、服务水平、服务质量均有保证的服务提供商。虽然灾备外包服务商没有统一的选择标准,但是企业可以从服务资质、服务客户、服务经验、服务体系、运维管理体系、客户满意度等多方面衡量服务提供商的能力,如是否具有高等级数据中心或灾备中心服务网络;是否具有灾难恢复服务资质;是否具有经过认证的ISO20000、ISO27001、ISO9000、BS25999等标准化服务流程;是否有相关行业客户及成功案例;是否具有经过实践检验的服务方法论和流程等。

4未来

高可用管理,灾备能力的再提升

在灾难恢复体系规划和建设过程中,普遍存在一些问题:国外的灾难恢复体系规划建设方法是从19世纪80年代IT系统可用性改进过程中逐步发展和完善起来的,在发现单数据中心通过以部件冗余、系统冗余、数据安全、数据备份恢复等技术为代表的本地高可用技术不能完全解决重大事件引起的中断后,逐步发展了包括紧急事件管理、危机公关、灾难恢复、业务连续等相关的理念和方法。

可以说,国外的灾难恢复和业务连续管理理念和方法是以成熟的高可用性管理为基础和支撑的。灾难恢复体系的建设是完整高可用性管理的外延和扩展。

而目前,国内的IT系统虽然在建设和规划过程中使用了很多成熟的高可用技术,但对高可用性管理却缺乏统一的认识和整体的规划管理方法,甚至会出现舍本逐末的现象,对灾难恢复体系的建设寄予过高的期望。好像灾备中心建成后,以后不论出现什么问题都可以通过切换到灾备中心来解决。而实际上灾难恢复体系并不是万能的,受到灾难恢复体系的等级、使用的技术、灾备中心的距离和物理位置等限制,灾难恢复体系并不能解决所有的问题。它只是整个高可用性管理体系中的一个环节,只有从整个IT系统的角度,在技术和管理方面对整个系统的可用性进行通盘考虑和规划,才能真正达到预期的可用性目标:将IT管理人员从惴惴不安的等待火情发生的救火队员的角色中解救出来,从规划师和设计师的角度重新审视整个管理范围,消除可能隐患、布置监控和管理工具、对重要区域和高风险事件进行重点防范,达到既提升了安全等级,使IT系统风险管理有序可控;又提升了管理效率和工作品质。

虽然很多IT管理人员和服务厂商在IT系统可用性的提升方面投入了大量的成本和精力,甚至可以说不遗余力,但实际结果却是各自为政,效果无法预期。这主要是由IT系统的复杂性所决定的,现在的IT系统服务可用性依赖于技术和管理的不同方面,包括:数据中心基础设施、技术架构、信息安全、灾难恢复等,涉及网络、存储、数据复制、安全、监控、空调、电力等不同技术领域,而且往往取决于最薄弱的环节和最短板。

因此,提升IT高可用性管理水平需要从IT架构及运维管理、基础设施及管理、灾备建设及运维、安全及管理、IT治理等方面全方位考虑,整体改进和提升,使IT系统始终处于一种高可用的水平。

从实施策略方面看,企业首先应在基础设施、应用系统、中间件、数据库、操作系统、存储、服务器、网络、灾难恢复体系和安全防御手段等技术层面实现高可用,确保企业IT资源运行的持续性和应用系统运行的安全性和稳定性。其次,应在基础设施管理、IT服务管理流程、关联组织、人员、治理结构、灾难恢复体系管理和安全管理等管理层面确保IT服务的可用性、安全性和持续性。

共3页: [1] [2]3 下一页
责编:张欢
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918