罗健:如何把存储变得更加简单

  作者:Amteam.org
2006/3/13 11:09:00
本文关键字: 存储 备份

51CTO.com独家特稿】本文是EMC存储专家罗建在2006教育信息存储大会上的发言,本次大会由51CTO独家直播。

直播页面:/exp/zhibo/

我下面介绍的内容是把存储变得更加简单。这是我中心的话题。 如果不做简单,我想在座的朋友们,老师们,也没有时间去研究这一个SAN里面的通道怎么样传输,怎么样连接,要装什么软件和硬件,现在信息系统遍布校园各处,怎么样把信息连接起来,形成真正的信息共享,这么大的一个任务我觉得是靠几个人是很难完全的工作。

要把存储做得简单,首先大家要知道,信息的存储,他要走向一个网络化,走向网络化是我们必然之路。

我们知道,在我们读大学的时候,当时的计算机只有计算机中心有,大家到大型机上上机。现在读书的大学生条件很优势了,很多家长给买笔记本,在寝室里面自己可以用计算机。

说明了一个什么问题呢,信息技术从一种集中化走到分布化了,大家要共享信息采取什么方式呢,90年代初,出了一个IP网络。它把成千成万计算机联到一个共同网络环境里面去,可以形成网络化的共享,大家肯定会想到这样一个问题了,怎么样变得轻松容易呢。 这么多服务器到英特尔上来,现在存在一个问题,服务器的东西怎么样共享呢?它的服务器后面的内容越来越多之后,就要放到存储里面了,而不是放在服务器里面了。就把磁盘放到一个专门的管理磁盘的计算机。我们今天在国内叫海量存储。海量存储更加严格地说是一个阵列,把里面几百个甚至上千个独立的磁盘放在里面,它专门来管理,这就是所说的海量存储了。所有磁盘管理工作和信息管理工作都是海量存储的系统来完成的。所以这是一个由软件、应用来做的。

刚才谈了服务器有这么多内容需要共享,内容多了之后,别的服务器怎么样来共享呢?课题就出来了。

把这么多分散的服务器都连接起来,但服务器要访问这一些内容,就形成了共享平台了,这就是存储网络诞生的背景。

现在存储网络连接的协议不像服务器跟前端、客户端的连接。服务器要很快获得存储的信息,要很快的速度。但是呢,为了把现在的IP很好的用起来,又想了一个招,把这一些用因特而连接起来,这就是大家听到的IP存储,现在已经开始在使用了。现在要建立一个网络存储,不是一定要去买交换机的。因为我们在学校里面的应用,对性能不是很高,实际上也是可以用现在的IP的,用IP把服务器存储联起来,用现有的资源联起来。 现在既有光纤连接,又有IP连接,信息孤岛又出来了,现在我们把IP连接起来的存储和SAN联起来,不要出现信息孤岛。

第一,为什么要把存储变得简单?这是一个概述。说明了我们的网络的连接太复杂了。我们要解决他们共性的问题。什么是共性的问题,大家都有一个问题:

1、存储的容量。

2、可扩展的能力。

3、数据备份的问题。

4、信息怎么样归档。

5、怎么样做的容量。

这是常用信息存储当中碰到四大问题。围绕这四大问题,我们推出了解决方案。

一,怎么样把信息存储整合,包括了SAN,还有内置型磁盘,有各式各样的方式,怎么样连接起来,让服务器形成一个统一的网络的环境。

我们的解决之道是什么呢,如果你性能要求比较地高,我建议你们还要用光纤,它是一个直接的带宽的独享,你的性能能够得到保证。大家看到我们EMC的产品会面带一个I,说明我们是支持IP支持的。 大家知道,用IP连接起来了,我们不要额外地投资,我们不要去买特别的交换机,它的条件就是要前端一定只有Windows和LINUX。如果你过来IP的,我通过IP来解决,如果你是光纤的,我通过光线来解决。这就是我刚才谈的把不同网络协议整合起来。

什么样的情况下,我会去用我们的NAS呢,是专用文件服务器,而我们谈的存储是解决块的图形,大家常用的数据库,数据库这一种应用,一般都是用我们的直联。让文件系统这一种数据以流的方式来管理。所以用我们的NAS。还有现在一种存储,是什么样的存储呢,是基于对象的存储,有一些数据格式不统一,比如说,有人介绍材料和图片,还有一些医疗的介绍,还有各种照相,它的画面不可以用数据来描述的,也不可以用文件系统来管理,现在人们解决之道就是用对象来描述它。所以第三种是机遇而的对象的存储。 你要管理你的数据,首先你要知道你的数据是什么样的格式,如果是以块来访问的格式,你的数据库是支持块图写的存储,用SAN,如果对象是文件来管理,你就用NAS,还有一种,你不可以用块也不可以用文件来管理的,就用对象。

第二个层面,把存储整合合起来之后里面的第二个难题是什么呢,把这一些数据很好的备份和恢复,现在既有基于磁带的备份也有磁盘的备份。

第三个难题是怎么样归档。有一些信息数据不是很频繁,我要放在廉价的存储里面去,我把它归档起来,我需要的时候,偶尔地查询它。

第四,他们的共性是保护。 围绕四个层面,我们相对应的有四个不同的解决方案出来。让它变得简单,怎么样变得简单呢,大家也可以看到,在这一个图上面有很多服务器,自己有内置式磁盘,通过IP等等可以共享空间了。现在的网络连接,刚才也已经介绍了,有SAN,有IP、有NAS,还有一种基于IP,但是管理的是对象。

在一个局域网里面,如果我既有文件系统,又有数据库,我可以用一个既支持文件系统和数据库的存储来共享。另外一个,大家可以看得到,现在有很多文件系统服务器,我相信你们回去,在图书馆也好,还是在一些科室有很多通用的文件系统,他做的工作既有电子邮件,也有打印,也有一些文件管理等等,这一些利用率非常低,可以放在专门地服务器里面。 里面任何一种需求,在存储整合里面,我们有对应的软件和硬件和服务。让你们得到一个打包的解决方案。比如说,你是没有网络,但是我要去做我的存储整合,我10个、8个服务器联起来,这是我们的一个存储产品,加上你们的软件,加上你的服务,把所有服务器连接起来。

二,我连接的距离比较地远,超过20、50、100米,甚至几公里,我们是基于光纤的连接。

我们现在最远的距离在我们实践当中到100多公里,就是服务器跟存储的连接,也是可以完全保证性能的。如果你的需求是专门对文件系统的整合,也就是说我们的NAS产品,加上你们的软件,加上我们的服务。打包可以帮客户解决问题。

第二个难题刚才说了,就是备份和恢复,我们有小规模的备份和大规模的备份,我们有硬件和软件,硬件是根据他的容量,软件是根据他的性能,服务是根据你的要求的服务的水平。你说服务水平要求很高,比如说,像核心的区域里面,做到7乘24,我们有相应服务的提供。还有一些在图书馆里面,停10分钟也不碍事,对这一些服务相对来说比较地低。你自己都可以做这一种服务。它的产品也相应的有中低、高。我们介绍入门级,比较地简单。

入门级就是大量的桌面级,台式机也好,笔记本也好,如何把他们统一的做备份呢,这就是我们的一个软件。这一个软件可以小到自己去作备份,大到几百个桌面机集中化的备份。备份到我们磁盘系统里面来。中规模上来了,我们也有对应的产品,他可以备份到上面来,把你的数据按照你备份的规则或者说是时间的限制,它去完全一个备份,自动化地实现。再往高走,我的备份不要影响我业务的性能。比如说,我们正在做基因的连使得重合的组合,计算量非常地大,我要做备份,不要影响我的性能,可以加一个软件,把数据存储到另外一个区域,在区域里面通过通道的去完全备份。

现在有一种方式,就是备份而不是磁带而是磁盘,因为磁带有几个局面性。

第一,磁带介质容易发生质变,比如说它的温度和湿度、磁场的情况,你读的时候会有错误。比如说,过了几年,你再听磁带,它的音质比较地差。我们客户要过几年要重新翻一下,看有没有问题,如果有问题,要马上换磁带。现在换磁盘,以前它的价格比较地贵,而且价格也是差不多了。而且磁盘是在一个真空的实体里面,它的盘片不会受到影响,所以他的时间保留是非常长的,再加上磁带坏了就不能用,而我们磁盘是可以修复的,有一个地方坏了,它还可以一样的工作。即使坏了,客户也是感觉不出来,只是觉得慢了一点了。

两个T的存储,对我们现在的存储来说是非常非常小的容量了,我们大可以达到3个T了,最小的价位是在两三万人民币左右。最大可以到3百万美元。因为大家知道,存储是专用的计算机,里面越大,它的CPU越大,它的功能越强,他实际上就是一个大型的并行的计算机,所以就非常的昂贵了。 你如果要备份数据,有两种磁盘。可见信息容量的增长和信息的密度同步在发展。像这样的,如果容量很大,你有上十个TB的备份,可以备份到这儿来。对这一类的存储,如果你再加上一些软件,使它的备份不受到影响。

现在还有一种方式,把备份恢复跟归档形成一体,备份跟归档是不一样的。 第三个我要介绍的是,在归档功能当中,大家要一些什么样的问题?

只要做了备份恢复了,你同时要考虑的问题是要归档,为什么要做归档呢,现在很多个人电脑里面,你现在看到,40GB、80GB、100GB觉得很便宜,我都放在里面,实际上你看到很多内容很少去访问,比如说3、4年你出去玩的时候,数码相机的图片,你放在自己电脑里面了,里面也有一些电影,已经看过了。把里面的空间是占用了。你的性能是下降了,个人是这样的情况,到了一个学校一个单位一个团体就成大问题了。你买了那么多昂贵存储系统,真正有效访问是占20%,这是业内的统计。70、80%的内容是很少访问的。你不如把它拿走啊。就像房间里面堆了那么多椅子,你要跳舞,能够跳吗。把椅子搬出去,舞场就出去。现在的人们看不到信息里面的东西,凡是什么样的东西都往里面放实际上放了很多垃圾在里面,也可能不是垃圾,利用率比较地低,但是可能需要随时地查。比如说图书馆里面的资料,平时很少有人看,但是人们一查查不到就着急了。现在想到了一个归档,你可以在线随时访问它,但是他的价位比一般的存储要低很多。这就是我们要考虑的归档的问题了。

举一个例子,电子邮件,大家知道,如果你对电子邮件用过的话,你会感觉到在你的邮箱里面你看过的邮件还存在那儿,占用空间,但是他的价值基本上是零。但是呢,你又不能把我的邮件删掉,万一我要查的话,就找不着了。所以归档是最好的策略了。为什么要对电子邮件归档,这是额外地话题了。我们采取的策略是,用我们的软件,你设定一个策略,过了三天、五天的电子邮件,只要我看过的,他会自动地归档一个更加廉价可以在线访问的环境里面去,它的价位非常地低。但是你会感觉到,你随时要,它是随时在。这就是我们基于对象的存储。基于对象的存储和我们常规的NAS和SAN不一样,也就是说,你需要编程序才能访问。这样的存储要跟你的应用结合起来,比如说,图书馆里面大量的文档、图书的资源,放在图书馆里面价位比较贵,空间站用也是比较多,如果用自动化归档的方式,价位又便宜,又是一个无限大的空间。因为一个存储,它就可以上几百个TB。你要增长多少,他有多少,所以我们把它当成几乎是无限制的存储环境。插上一个网络交换机就可以了它的容量就增长出来。在我们的客户环境里面,在归档里,用这一种存储非常多像一些图书馆和医院,它的一些电子照的CT等等容量非常大,用户过两三个月查内容,用这样的产品也是非常地合适。

最后,就是数据安全。这是大家需一个人关心的话题。个人电脑的数据安全到企业的数据安全,甚至你图书馆你存储信息电子化以后,你考虑的首要问题是这一些数据得到了保护吗? 如果你做磁盘的备份,你想过没有,备份的数据能够正确地恢复过来吗?你需要作一些认证和演练。还有一个,就是我们谈到整个业务系统的连续性,整个业务系统连续性有几种方式来保证它,一种是基于阵列,这不是磁盘阵列内部完全,而是两个磁盘之间来完全,可以到10到20公里。两个磁盘完全是实时完成的。 第二种方式,基于IP完成数据的复制,这是基于磁盘阵列的复制,但是它有一个时间的延迟。它最快的情况下,把这一个延迟的时间里面的数据丢失了,最远里是几百公里,丢失了怎么办啊?它也可以恢复,但是恢复的时间比较地长,以一个小时为单位。刚才实时以秒为单位来进行恢复的。

还有一种方式,我可以以天来恢复,10天以上恢复我都可以接受,就可以基于IP服务器环境来恢复。两个相隔距离比较远,你恢复的时间也是比较地长,你的费用也是比较地低,也是可以采取IP的方式来恢复。

如果我需要距离远一点点,但是要实时地做恢复,我们采取同步的方式价格比较地高,采取光纤直联来完全复制技术。这解决我们常谈的业务连续性。 我们怎么样保证我们客户数据应用在任何环境下会得到我们数据的保护和业务的保护呢?我们采取不同的策略,我们有两个指标,恢复时间和恢复数据。这两个指标可以衡量你,你可以恢复的水平有多高。 EMC在全球,从国外的企业到国内的企业,从大企业到小企业,都在用我们这一套系统。好处是做到即使发生特别意外的情况,我们的数据依然可以用。

我前面给大家介绍了四个方面,我们的直通解决方案,大家会提出这样的问题,大家有这样的解决方案,EMC为什么把它叫做直联方案呢,怎么样把它做得简单呢,说白了,就是打包。按照你不同的要求,我们给你不同的解决方案,我们以钥匙工程来完成对方问题的解决。

第二,EMC跟别的厂家不一样在哪儿? EMC是79年成立的,到今天快27年历史了,专注信息存储和管理,从基本的外部存储做到现在,包括信息安全的软件,EMC在业界是一个领头羊公司。我相信,只要接下来大家做存储管理的时候,用我们直通方案,会的存储不是一件难的事情,是轻松容易实现的事情。 谢谢大家!


责编:
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918