这些年我们追过的容错技术

来源:畅享网  作者:杨雪姣
2012/11/15 14:30:33
畅享网:容错是指服务器对于错误的容纳能力,服务器容错强调的是对于服务器整个系统的容错。企业为什么需要容错服务器呢,为了追求在应用过程中的稳定性,为关键业务应用提供可靠的硬件平台。

容错是指服务器对于错误的容纳能力,服务器容错强调的是对于服务器整个系统的容错。企业为什么需要容错服务器呢,为了追求在应用过程中的稳定性,为关键业务应用提供可靠的硬件平台。服务器在应用过程中会发生各种各样的故障,比如间歇性故障和偶然性故障。

容错服务器在设计上, CPU、内存、I/O等,全部采用冗余设计,并通过锁步技术,对每个计算过程进行比对,准确无误才会进入下一个步骤,可以最大程度上校正硬件故障,其系统的可靠性可以达到5个9的水平。

有的用户认为有了容错服务器就可以万事大吉,服务器就不会宕机,事实上容错服务器只可以通过有效的技术解决硬件原因造成的系统故障,但是并不能解决软件故障。如果是软件本身的问题,无论是操作系统还是应用软件,那么容错服务器没有办法对于这种错误进行修整。

目前常见的服务器系统容错技术有三类:服务器集群技术、双机热备份和单机容错技术。它们所对应的容错级别是从低到高的,也就是说服务器集群技术容错级别最低,而单机容错技术级别最高。

服务器集群技术:服务器集群技术不仅可以做到容错,还可以实现负载平衡,提高服务器的性能。

双机热备有两种实现模式,一种是比较标准的,两台服务器通过一个共享的存储设备(磁盘阵列或存储区域网SAN),并且安装双机软件,实现双机热备,称为共享方式。另一种方式是通过纯软件的方式,一般称为纯软件方式或镜像方式(Mirror)。

单机容错技术是由一台服务器实现高性能容错,它的容错能力要远比服务器集群和双机热备份的容错能力高,通过CPU时钟锁频和对系统中所有主要部件的冗余来实现的容错,包括CPU、内存、网卡和I/O总线等。通过系统内所有冗余部件的在线同步运行,实现真正意义上的容错。

现在,虚拟化云计算技术大受追捧,使得计算资源并不依赖于单一系统的高可靠性,是否会意味着容错服务器的终结?

Vmotion技术,也就是虚拟机在线迁移被寄予厚望。当虚拟机产生故障时,在线迁移到另外一台虚拟机。但事实上,这只是一种误解。Vmotion可以解决计划内的停机,如系统维护、升级时,可以暂时将虚拟机迁移到其他服务器,维护升级完成之后,在迁移回来。但Vmotion不能够解决计划外的意外宕机。但承载虚拟机的物理服务器意外宕机时,虚拟机是没有办法进行热迁移的。

在虚拟化环境里,高可靠性需求就需要采购Fault Tolerance模块,对于低一些要求的应用,需要采购HA模块。如果你需要高可靠性,实际上,你就需要容错,虚拟化技术并不能够解决高可靠性的难题。

责编:杨雪姣
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918