2008存储七大热点技术深入讨论

  作者:吴子超
2008/1/3 0:00:00
本文关键字: 存储 管理

    每年用户的系统管理员都会接触大量的存储新品。其中一些新品将会被大家广泛的接受,一些则可能只适用于某些特定用户,当然也有不少存储产品,在闪亮登场之后,很快就销声匿迹了。这样的竞争的确非常残酷,不过这就是现实。

    公平的说,当各种新技术从实验室里诞生而转入市场的时候,我们通常很难辨别哪些能够生存下来,并且成功的改变系统管理员的工作方式,而哪些最终只能黯然退场。现在恰好是2008年的开端,我们在这里一起详细评估了几项新的存储技术,这些技术都声称能够增加数据中心的效率,而且会解决数据中心的各种问题。

    这些技术包括LTO-4,它可以增加容量、速度和AES-256到磁带系统;N_Port ID虚拟化(NPIV),这项技术允许多个虚拟化设备共享一个物理光纤端口;还有数据重复删除(deduplication),数据重复删除,可以极大的减少存储数据的数量。同时我们还评估了两个热门的技术方向:ediscovery,使得存储能够遵守最新的法规;还有就是绿色存储,面对高昂的存储费用,我们迫切需要绿色存储。

    这次讨论中,我们也列出了5项可能需要更长时间才能完善的技术,这些技术还处在发展初期,我们感觉在2008年还难以流行。在我们展望未来技术潮流的同时,我们先回顾一下去年我们的预测。看看我们去年对于趋势的判断与分析在哪些层面准确,哪些则有失偏颇。

    2007年预测回顾

波澜不兴的LTO-4

    LTO-4是最新的LTO磁带格式,不过尽管LTO-4算得上是领先的技术,但是现在却出奇的安静。而且很少有产品采用这种LTO-4。

    CipherMax 市场部主任Greg Farris 表示,“其实IBM和惠普已经开始制造相关的LTO-4产品,不过产品在最终市场上的确很少见到。”CipherMax公司提供迁移工具,可以将数据从LTO-3 迁移到 LTO-4。而该公司也正在等待LTO-4市场的兴起。近年,一些法律的新规定,比如加利福尼亚的SB 1386 法律,要求重点保护个人信息,这对于数据存储提出了更高的安全要求。而对于保存数据的公司,他们普遍需要采购加密技术的磁带,而提供了嵌入式AES加密技术的LTO-4恰巧是他们为数不多的选择之一,尽管LTO-4可能还需要一些管理方面的改进。

    GlassHouse科技咨询的数据保护副总裁W. Curtis Preston表示,“加密技术是用户选择LTO-4的重要理由。当然LTO-4也使得存储容量提升到了800GB,而且传输速度也达到了120MB/s,不过,这些都只是选择LTO-4的次要理由。最主要的还是加密技术。”当然,容量和速度的提升也使得Patillo Construction、Stone Mountain、GA等公司迅速采用了HP的全新LTO-4产品,因为这些公司的业务对存储的速度和容量有较大要求。

    Patillo工程设计和建设公司的信息主任Buzz Kaas表示“我们之前的备份不太够用,而且备份的时间总是超过预期,影响到了工作。” 使用了惠普的LTO-4 Ultrium 1840磁带库之后,Patillo公司可以在2小时内备份500GB的容量。

    有趣的是,Patillo公司其实不怎么需要加密技术。Kaas表示“我们已经采用了新的LTO-4磁带库,不过我们现在才考虑其中的加密技术的使用,这对我们而言,不能算得上是优先考虑的因素。至少现在还不是。”GlassHouse公司的Preston对我们说,“LTO-4可能还有三方面的缺陷:秘匙管理,秘匙管理,和秘匙管理。”安全设置需要每个独立的LTO-4磁带有一个不同的秘匙。随着存储的使用,很快将会有数百个秘匙,对于大企业,存储系统甚至将拥有上千上万个秘匙。

    如果你丢失了一个秘匙,那么就意味着你永远丢失了其中的数据。所以,脆弱的秘匙需要保护,你复制数据,你同样需要复制安全秘匙。这样复杂的情况,着实令人头疼,所以各厂商也将提供秘匙管理。不过秘匙管理可能非常不健全,因为暂时各个厂商并没有统一标准,互相并不兼容。

    不过,秘匙管理统一标准的工作已经开始了。互信计算集团的秘匙管理服务小组Trusted Computing Group's (TCG) Key Management Services Subgroup (KMSS)已经为统一标准的目标工作1年了。当然,其他的集团也有相类似的工作在做,乐观的估计,2008年或者2009年,秘匙管理标准将有最终结果。

NPIV

    “虚拟化,可谓是过去一年存储领域最热门的词汇。而今年虚拟化将继续普及。NPIV部署了虚拟化在FC SAN领域。几乎所有的物理环境融入虚拟化,性能都得到了提升,NPIV也不例外。”Enterprise Management Associates的Mike Karp这样表示。

    NPIV解决了多个虚拟服务器在FC SAN的访问问题。通常,SAN对每个服务器都需要一个端口ID。SAN使用端口ID 作为masking和zoning的基础。IBM下系统存储集团的首席战略师Clodoaldo Barrera这样解释“虚拟服务器共享物理HBA,而且有一个虚拟端口ID。”NPIV详细定义了多个虚拟服务器可以共享一个物理端口ID。

    对于存储管理员而言,NPIV的优势已经很明显。“想通过NPIV取得效率,就必须得到HBA和交换器支持。”Emulex的副总裁Scott McIntyre这样认为。HBA和交换器厂商已经开始将NPIV融入到他们的产品当中,消费者将可以通过升级HBA和交换器得到NPIV。

    NPIV同时也在软件虚拟化领域发挥了影响。微软的虚拟服务器在2007年开始支持NPIV,VMware的蓝图也显示2008年将支持NPIV。IBM的System Z中支持NPIV,而且集成到了其刀片服务器当中。当然,也并非所有的存储厂商都看好NPIV。还是有一些厂商不认为这是一个大趋势。

    也并不是说我们可以忽视NPIV。如果要充分利用NPIV,我们必须检查硬件、软件、和固件,还有操作系统版本是否支持NPIV。一旦部署了,存储管理员必须多留意NPIV带来的影响,因为它可以影响架构、zoning 和masking配置,还有整个管理的质量。

数据重复删除

    “数据重复删除是近年重要的技术。”GlassHouse的Preston表示“数据重复删除定义并且删除了许多数据拷贝,那些重复的数据占用了大量的空间,而且还延长了备份时间。”通过减少大量的数据存储,数据重复删除解放了容量和带宽,同时也减缓了公司新增存储设备的需求。更少的存储设备又意味着更低的开销,还有更低的能源消耗。

    Integral Capital Partners是一家私营投资公司,已经转向了数据重复删除,来加速其隔夜备份。公司操作的设备分布在两地——Menlo Park 和Baltimore,每个地区存存储本地数据,而晚上则在两地之间复制数据。“这个过程一般将持续8小时” 信息系统管理员Jason Paige表示。Jason Paige在2007年早些时候开始寻找更好的解决方案。但是他没找到什么“我不希望磁盘像磁带一样工作。”他表示。

    最终,他找到了Avamar,这是一家EMC旗下的公司,Avamar将文件切成碎片,再由这些碎片申请数据重复删除,从而只传输变化的数据。通过T1线路,Avamar每天晚上复制300GB-500GB的容量,而Avamar本身就可以存储2TB的容量。“通过数据重复删除,我们可以将我们的备份时间压缩到45分钟。”Paige表示。

    “数据重复删除,也是一个改变策略的技术。”Taneja 咨询集团的创始人Arun Taneja表示,“这项技术已经可以使每个VTL都包括数据重复删除。”尽管数据重复删除看起来非常有发展,不过它还是有着一些缺陷“它恢复数据的时间十分漫长。”StorageIO Group的创始人Greg Schulz解释“同时,数据削减也十分依赖你的某些特定数据。”

2008年,一些不成熟的技术

    下面是一些我们觉得还不太成熟的存储技术,我们认为可能在2008年不会普及。

自动存储层级
    自动存储分层通过自动的移动数据从昂贵的存储到便宜的存储层级之上。RobertGrayDirect公司的Robert C. Gray 表示“最困难的地方在于数据分级,因为分级之间的连通可能还有些问题。其实我们还需要很多改进,例如不同厂商的产品之间我们还不能转移数据。而这一点在存储实践中非常重要。”

存储表现报告工具
    一些报告工具可能会将存储资源管理storage resource management (SRM)推向一个新的高度,这些工具可以显示基于不同管理服务的存储的表现。StorageIO 集团的创始人Greg Schulz 表示,“这些报告工具目前比起以往的SRM的确强一些,但是提升的幅度还不够大。我们需要的是真正强大的分析信息的工具。”

栅格存储
    理论上,栅格存储提供了一个可扩展的、高可用的、适应性强的存储环境,其中有可根据需要添加的智能存储隔间。这听起来蛮不错的,但是目前还是缺少栅格存储产品。这些产品来的比蜗牛爬的还慢。所以,各个企业也不再苦等栅格存储产品了,而是转而采用群集来获得一些栅格存储承诺提供的优势(至少是可用性)。

企业加密的秘匙管理
    正如上文提到的,秘匙管理的工业标准非常重要。但是目前还没有一个统一标准。照目前的情况看来,我们估计还需要等到2009年。即便那个时候,我们还需要时间来将标准普及到各个产品当中。Schulz认为“每个厂商现在都有自己的迷匙管理标准,这实在是不应该,这种各自为政的现象很幼稚,损害了所有厂商的共同利益,但是目前还没有大厂商真正扛起标准的重担。”

磁盘备份到磁带
    磁带不会消失,这一点好像也不算是什么新闻。而磁带和磁盘之间的中间部分,发展确实也比较迅速。跟D2D的离线存储一样,Disk-to-disk-to-tape (D2D2T)已经开始变得越来越流行。Integral Capital Partners 的Jason Paige说“通过磁盘磁带之间的复制,我可以备份全部100%计算机的内容而不用磁带。如果有谁问起我们的备份,我就直接告诉他我们采用离线存储,他们也接受了这一点。”

Ediscovery

    如果你还没有接受ESI电子存储信息(electronically stored information )概念,那么你将来可能在法律诉讼上吃大亏。因为根据最新的美国法律FRCP,ESI已经拥有了与传统纸媒一样的法律地位。

    Ediscovery是一个过滤ESI的进程。现在,只要诉讼被归档,组织就必须保存、保护所有相关的数据。“在FRCP上的改变很快导致了人们对Ediscovery的浓厚兴趣。”Socha 咨询公司的创始人George Socha表示“Ediscovery工具和服务也同时处理了相关的进程,比如法律保证管理——这对于保护ESI在诉讼中至关重要,包括了保持管理(retention management)、案例管理、工作流(workflow),另外还有文档管理,这涉及了整个诉讼的流程。

    Socha出版了ediscovery的年度报告,而且追踪了其中的厂商。“至少,有600个组织提供了ediscovery服务或者产品。”Socha表示,“其实统计上共有800多家,但是其中一些已经消失了。毕竟破产或者业务转向每年都在发生。”

    Socha的年度报告,在相关研究匮乏的情况下,在ediscovery领域有风向标的作用。这份报告里的顶级厂商包括了Guidance Software、Kroll Ontrack、Zantaz(最近被Autonomy收购)等等。而其他的顶级厂商如Index Engines Inc.、Kazeon Systems Inc.,等公司则可能更为我们所熟悉,可惜都没有出现在Socha的top20中。

    Onsite3,一个美国弗吉尼亚州的ediscovery服务提供商在Socha的名单里排名第18,这家厂商使用了目录引擎工具来寻找被埋没在磁带之中的关键数据。“目录引擎让我们有能力索引整个磁带,而不用恢复磁带。我们只需要恢复我们需要的文件就可以了。”Onsite3的电子证据实验室主管Jeff Fehrman这样表示,“比较恢复整个磁带的方法,目录引擎减少了很多数据恢复的时间,而且恢复的数据量可能仅为原来的1/10。我们有医药金融客户,他们需要搜索成千上万的磁带。”

    TiVo公司也开始使用Kazeon公司的产品,来进行法律层面的自我防卫。“我们发现在管理不善的情况下,ediscovery会很昂贵。”TiVo的法律事务主管Karen Kramer表示“不过部署了Kazeon,我们的费用和任务量都小很多了。”TiVo在自己的服务器上运行Kazeon,使用它来处理跨Unix、Windows、Mac和Linux的ediscovery事宜。Kramer表示“Kazeon采用了许多信息资源,并且将这些资源集成到一个搜索当中。一些别的厂商的ediscovery需要单独的服务器,而我们目前所采用的方案,是集成在自己的服务器之上的方案,所以费用方面会有所节省。”

绿色存储

    Uptime公司的首席能耗策略师Bruce Taylor表示“绿色存储并不仅仅是一时流行。在未来三年中,能耗费用将可能超过服务器和存储设备的购买费用。以往,跟服务器相比,存储设备似乎并没有太多的能耗问题,不过随着存储需求的日益增加,能耗也将变成存储的一个重要的问题。”

    存储工业目前还没有开始认真思考能耗问题,也没有认真的问上一些简单的问题“为什么我们必须使用磁盘来存储,为什么不多用磁带?”Taylor认为,IT必须重新思考自己的数据存储策略。

    减少存储能耗的方法
    ● 转换成容量更大的磁盘
    ● 使用速度更低的磁盘(7,200 rpm 和10,000 rpm)
    ● 增加磁盘利用率
    ● 通过数据重复删除和压缩减少数据卷
    ● 将较少使用的数据转移到磁带
    ● 尽量用磁带备份,而不是磁盘
    ● 虚拟化和合并(consolidate)存储
    ● 非活动磁盘阵列massive array of idle disks (MAID)分配给近线归档(nearline archiving)
    数据来源: Stanley Zaffos, research VP, Gartner Inc.

    在Epilepsy Phenome/Genome Project (EPGP) 癫痫基因/表现体项目研究的管理员开始计划数据中心的合并的之前,他们心中并没有一个能耗概念。Michael Williams作为项目的CIO,表示“我们有很多站点。我们的DAS平均利用率仅为40%,我们浪费了很多服务器和存储资源。”该组织随后合并了数据中心,部署了虚拟化和自动精简配置。在过程中,10架(10 racks)服务器被合并为两架,采用了两个数据重复删除的存储池,又将每个150TB的存储池缩减到25TB。这无疑是惊人的提升。

总结:

    如果你不愿意在今年部署任何一项新技术,这当然可以,但是你不可以排斥新技术。因为不管我们是不是愿意,绿色计算、诉讼和数据加密等技术还会继续发展。而数据重复删除、NPIV, LTO-4和ediscovery正是各种新技术的载体。当然,我们绝对不希望你被卷入一场法律纠纷、不小心丢失了备份磁带、或者你的能耗费用超标,所以我们向你介绍上述技术。最后,我们衷心希望这些技术能在2008年帮到你的忙,让你更好的处理各种问题。

责编:
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918