|
IT服务管理让“救火队”解脱(AMT 管 政)提到IT服务管理(ITSM),提及频率较高的一个词就是“救火队”,ITSM解决方案提供商在推广ITSM产品时,习惯于说IT服务管理有助于企业IT部门从“救火队”的角色中解脱。在本文中,我们将简要地分析一下IT服务管理的发 提到IT服务管理(ITSM),提及频率较高的一个词就是“救火队”,ITSM解决方案提供商在推广ITSM产品时,习惯于说IT服务管理有助于企业IT部门从“救火队”的角色中解脱。在本文中,我们将简要地分析一下IT服务管理的发展、IT服务管理的国际标准ITIL,并介绍一个IT服务管理的案例。在以后的AMT专题中,我们将系统地论述IT服务管理的方方面面。 一、ITSM正本清源 ITSM所属 在讨论IT服务管理之前,我们先来分析一下服务管理的概念。服务管理与普通的生产管理具有很大的差异性,它面临一些独特的挑战,而且生产管理方面的理论已经被研究了很多年了,相对而言,服务管理的研究时间还不是很长。其中,服务管理中一个最关键、最重要的一个特点是:在服务交付系统中必须要有客户出现。 按照一般经典的分类方法,服务一般可以分成五大类:(1)企业服务:咨询、融资、银行等;(2)经商服务:零售、维护、修理等;(3)基础设施服务:通信、交通等;(4)社会/个人服务:旅馆、保健等;(5)公共机构:教育、政府等。 从这个分类上来看,IT服务应该属于基础设施服务的范畴。但是,我们现在所强调的IT服务管理已经不再是停留在IT基础设施的建设上,更看重的是对IT资源的管理和优化,并且它已经上升到很高的管理层面。另外,它更多的是企业内部的一种服务过程,即IT部门为其他提供服务的系统化管理的过程。 ITSM本质 我们可以再来回顾一下, IT服务管理的地发展流程。其实,在IT发展早期,公司当时的IT系统非常简单,可能只有一台计算机,只要观察它的日常运行状况就可以了。但是随着计算机以及网络设备的逐步增加,此时企业需要进行系统的网络管理,这时候就需要一些软件来辅助对网络进行监控和检测。 下一个阶段,网络的分布式结构,即平台服务器俞加复杂,出现了多层结构,此时可以说是IT管理的一次升华,同时对IT管理员就提出了非常高的要求,IT管理员不仅要懂得硬件知识、网络知识,还要懂得各种软件知识,以及平台共享方面的知识,因而对他们提出了更大、更新的挑战。而这时候更需要专业化的IT服务管理解决方案来协助IT管理员来完成日常的IT维护与管理,否则容易形成一种“救火队”的工作模式,那里有困难就扑向那里,管理非常混乱,而且速度往往难以满足其他部门的需求。 按照这种思路,通俗地讲,IT服务管理更多的是一种方法论,它以PPT(人、流程和技术)为核心要素。ITSM解决方案一般是由多个相辅相成的模块构成的,IT管理员需要做的事情就是:监督每个模块的进展程度,以及各个流程是否完全到位。 ITSM是一种以流程为导向、以客户为中心的方法,它通过整合IT服务与企业业务,提高企业IT“服务提供”和“服务支持”的能力和水平。ITSM是联系“IT服务”和“业务需求”的纽带。ITSM的目的是建立“以企业内部IT用户为中心”的管理机制和运作模式,以提供高质量、低成本、可计量的IT服务。ITSM与ERP、CRM和SCM等管理系统和管理方法有所不同,前者更强调的是对企业整个IT资源的管理,而后者则是对企业营销、生产、财务、库存等内容的业务管理。 ITSM需求 作为IT系统的服务与支持部门,面对的是由各种网络、主机、系统软件、中间件、数据库、应用软件等等组成纷繁复杂的系统(例如从管理软件的角度来看,企业为了在新经济时代提高竞争力,引入各种管理系统,包括ERP-企业资源规划、SCM-供应链管理、CRM-客户关系管理和KMS-知识管理系统等),众多的软硬件耦合在一起,系统的复杂性和维护量呈指数级上升。逐渐地,IT系统的服务与支持部门“简直是一支消防队!”,哪里有火情,IT部门就扑向哪里。这种模式的IT资源管理,无法发挥整体IT资源的性能和功能。 许多企业在实施信息化战略时,一味地追求“技术高消费”,而忽视了对信息技术的管理和业务流程的变革。有些企业虽然实施了一些系统管理和信息管理,但其侧重点仍然只是事后的技术支持和故障解决方面。随着组织业务对信息技术的依赖程度的加重,以及“即时响应”、“随需而变”以及“客户导向”等要求的提出,组织在IT建设方面的成本越来越高,而其产生的效益却越来越难以满足现实的要求。 因此,要求IT管理要在考虑企业实际的IT需求的基础上实现IT和业务的最大程度的整合,从而使IT成为真正能够支持组织业务运作的第一驱动力。这就是近年来受到越来越多关注的IT服务管理所要达到的目标。 ITSM不同于传统的IT管理的最重要的特征在于,强调IT和业务需求的有效融合同时注重IT投入的成本和效益。在国际上,早在20世纪80年代末就开始了ITSM方面的理论研究和实践探索。由英国商务部(OGC)组织开发的ITIL(信息技术基础架构库)是ITSM领域国际上的事实标准。在欧洲其他国家,如荷兰等也在大力推广和应用ITSM的理念和方法。 二、ITSM大同小异 目前的全球市场上,出现了各种各样的IT服务管理方法,例如HP公司开发了该公司实施IT服务管理的方法论HP ITSM Reference Model(惠普IT服务管理参考模型);荷兰Virje大学软件工程研究中心(SERC)组织开发IT服务能力成熟度模型(IT Service CMM);IBM公司开发了包括8组41个流程的ITPM解决方案;微软公司为所有微软产品开发了MOF(管理运营框架);CA公司的Unicenter服务管理解决方案等。这些不同公司和研究机构推出的解决方案,应该说是大同小异,主要还是围绕ITIL核心流程的理念和方法。 ITIL(Information Technology Infrastructure Library):即信息技术基础构架库,它是一种在全球范围内正在兴起的IT服务和支持标准。它以高质量服务管理为核心思想,融合了IT服务管理的最佳实践。1980年以来,英国政府商务办公室(GOC,原称政府计算机与通信中心)为解决“IT服务质量不佳”的问题,逐步提出和完善了一整套对IT服务的质量进行评估的方法体系,叫做ITIL。2001年,英国标准协会在国际IT服务管理论坛(itSMF)上正式发布了以ITIL为核心的英国国家标准BS15000。 ITIL的核心流程和典型模块,主要有:服务台、事故管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、IT服务财务管理、容量管理、IT服务持续性管理、可用性管理,以及安全管理等。每个ITIL流程都包括五大要点:流程目标、基本概念、主要活动、好处与风险,以及关键绩效指标与报表。 ITIL是一套最佳实践,能够协助企业实践ITSM的相关流程;它可以在总体上帮助企业完善IT基础架构管理。ITIL是一个框架,它只告诉企业ITSM做什么(What to do)但是不限定怎么做(How to do)。 三、ITSM案例分析 新疆建行的信息化建设过程一直受到众人的关注,总的来说,该分行的信息化建设大体上经历了三个阶段,主要包括: (1)数据大集中阶段 2000年,新疆建行实现了数据的物理集中,把全疆的服务器集中到了区分行;2001年又实现了数据的逻辑集中,所有的数据都集中到了区分行。目前,新疆建行的核心业务和外围系统也都实现了集中。在进行核心业务数据集中的同时对外围业务平台也进行了集中,其中包括银证前置系统、中间业务平台、自助控管平台、票据清算系统的逻辑集中等等,根据总行统一部署,实施了银联卡联网工程。该建设阶段,新疆建行选择了IBM公司的主机系统和备份系统、EMC公司的存储系统、思科公司的交换机和路由器和BEA公司的中间件。 (2)总控中心建设阶段 总控中心的建设主要包括四个方面的内容:一是实现集中的、实时的、多渠道信息分布的系统监控管理;二是随着ISO9000体系的推广,必须借助系统工具来规范日常运行维护流程;三是实现夜间工作自动化;四是加强系统级的安全访问控制。新疆建行采用CA的Unicenter为总控中心系统建立统一的管理平台,集中管理新疆建行的网络、系统、数据库和银行业务应用系统,其自动工作流产品将新疆建行的夜间工作流程自动管理起来,实行完全图形化的集中管理。 (3)呼叫中心建设与数据仓库建设阶段 新疆建行将增加呼叫中心(Call Center),以进一步拓展渠道建设。同时在数据集中后,新疆建行信息化建设的另一个重点是,数据仓库的建设,以对集中后的数据源进行科学化分析。 以下我们重点分析新疆建行与IT服务管理相关的总控中心建设的过程 挑战:数据大集中后的困惑 新疆建行十分重视IT基础设施的建设,在银行信息化建设方面一直走在了全行业的前列,数据大集中之后,新疆建行IT系统的运营管理面临着比过去更加严峻的挑战,对日常系统性能监测、故障的诊断和预警、多主机之间的数据一致、海量数据的备份与恢复等,都与未集中时有了很大的不同。 摆在面前的主要问题包括:采用多主机集群处理方式,日常维护工作的复杂性、多变性大大提高,而维护手段仍采用手工或者半自动方式;维护的经验和知识也只集中在个人手中,并缺乏更有效的IT人员绩效考核的衡量标准。为此,新疆建行急需运用集中控管的手段管理信息系统。 方案:USPSD 根据IT系统所面临的挑战和需求,新疆建行领导对数据中心提出了以下要求,即加强系统的安全性、可用性,提高响应时间,提升管理效率。对于新疆建行大型的信息系统来说,数据中心要对所有的IT资源实现集中的、实时的、图形化的、智能化的系统监控管理,不是可以一蹴而就的;而且信息系统的复杂性,对管理人员素质的要求愈来愈高,信息系统的分布性对管理人员之间的协同作业的要求愈来愈高。 USPSD(Unicenter ServicePlus Service Desk)是CA公司IT服务管理解决方案之一,它以ITIL为基础,包含了大量高水准的辅助解决方案,如知识工具、协作工具和预测工具等。在这些工具的协同作用下,企业可有效减少支持操作的成本,提高向最终用户提供服务的速度。 CA有限公司(Computer Associates International, Inc.; NYSE:CA)为全球最大的软件公司之一,为企业提供管理其IT环境的软件与服务。CA关注的领域包括:网络和系统管理、存储和安全管理、门户与商务智能、以及应用生命周期管理。 需要特别说明的是,2000年新疆建行启动了ISO9002国际标准贯标工作。这项工作使新疆建行的整体流程获得了很好的梳理,为后来的总控系统上线奠定了坚实的基础。 2002年上半年,新疆建行的企业总控中心正式开始选型。通过对CA公司的企业管理工具Unicenter的综合考察后,新疆建行决定选择CA的Unicenter ServicePlus Service Desk(简称USPSD),建设总控中心(Enterprise Command Center,ECC)。USPSD是全面的企业服务台支持解决方案,能够协助IT支持中心有效地管理行内的所有资产、系统、网络及人员。此外,在服务台解决方案的基础上,新疆建行还选用了Unicenter Network & System Management(简称Unicenter NSM)、Unicenter Autosys、eTrust Access Control 和eTrust Single Sign-On几项产品,共同构建新疆建行总控中心系统项目。 实施:实现对数据中心管理 CA公司ITIL的ESM建设方法论通常分为五个阶段,12个步骤来帮助企业建设IT服务管理体系。下图描述了CA公司ESM方法论-5个阶段12个步骤: 经过三个月紧张的准备与客户化工作,新疆建行的总控中心正式构建成功。经过一段时间的试运行,USPSD在对信息系统的集中监控管理、自动化操作和提高用户自助能力等方面的效果凸显。数据中心通过USPSD来捕捉、记录和索引系统问题及解决方案,跟踪和监视服务水平协议(SLA),从而管理宝贵的IT资产,管理基础架构,变更工作流程。 USPSD还同新疆建行现有的基于ISO 9002的管理流程相匹配,以完成问题管理、资产管理、变更管理、日常任务管理和知识库查询等功能。 效果:走向主动高效 自从应用了USPSD,新疆建行数据中心的IT工作人员从原来的“救火队”角色中彻底解脱出来。USPSD为服务支持人员提供唾手可得的信息、功能及工具,通过自动处理加快了问题解决过程,提高了他们的工作满意度。 除了USPSD的成功应用之外,CA 的Unicenter NSM 为新疆建行总控中心系统建立了统一的管理平台,集中管理新疆建行的网络、系统、数据库和银行业务应用系统。在安全性方面,CA的eTrust Access Control 和eTrust Single Sign-On完成了系统级的安全访问控制。 通过总控中心的集中监控管理,新疆建行实现了信息系统管理效率和管理质量的同步提升,实现了技术、功能、服务三方面的完全整合,提供了完整的信息系统控制、管理、展示方式,改善了系统利用情况,提高了决策支持能力,降低了总的系统运行成本和风险,提升了IT部门的管理效率和服务水平,为新疆建行的核心业务提供了坚实的IT支持和保障。 用户体验 “说句实话,我们在实施总控中心项目建设时还没有接触ITIL的管理思想,当时只是从保障业务系统的稳定运行,为我行一线员工提供快捷的IT服务的想法来实施这个项目的。现在看来,总控中心的建设是企业IT管理发展到一定阶段的必然产物,它可以帮助我们对庞大的、异构的、复杂的系统形成统一的管理视角,有效地预警和防范系统故障的发生。最为重要的是,总控中心将IT服务的关键因素‘流程、人员、工具’有机地结合起来,对系统运行中产生的问题及解决过程进行全程跟踪,对维护过程中产生的经验进行积累形成知识库,达到知识共享,提高团队整体服务水平目的,同时也为运行维护人员的绩效考评提供依据。”在项目实施之后,新疆建行信息技术部主任工程师刘爱辉先生发表了自己内心的一些看法。 在项目实施过程中,应该说也遇到了很多问题,“主要是工具的问题,很难找到能完全满足系统需求的单一厂商的产品,同时还有产品和应用系统很好结合的问题,对此,我们采取二次开发和逐步完善的方式进行解决。” “实施后的经验主要体现在三点:(1)用IT服务管理思想作指导,结合实际解决具体问题;(2)总控中心的持续完善将伴随系统运行的整个生命周期;(3)需要配套的行政管理手段,决定系统是否有效运转的因素不是信息技术,而是制度、组织结构、规则与标准,最终是人。” “实施的效果主要体现四个方面:(1)减少系统故障时间,提高系统稳定运行率。2003年与2002年相比,核心系统故障率降低0.45%;(2)规范内部支持流程,提高管理效率;(3)减少人力资源,降低人力成本。由于采用图形化、自动化的管理工具,使系统维护的强度、难度相应降低,我行数据中心的值班人员由原来的每天4人减少为每天2人;(4)及时掌握系统运行状态,方便管理决策。另外,今年,我们打算将总控中心推广到全疆范围,并对以前没有监控的系统进行监控,近一步提高系统的稳定运行率,力争机房无维护人员职守。” 作者联系方式:guary.guan@AMTeam.org
责编:管政 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 |
专家专栏 |
|