重复数据删除技术的几条建议

  作者:Amteam.org
2008/8/19 12:29:00
本文关键字: 存储 备份

尽管重复删除技术已经逐渐成为一项热门技术,但是很多分析师和用户都提出,要谨慎的对待它,不要因为广告大肆宣传而盲目追捧。

重复数据删除技术旨在删除冗余的备份数据、确保同样的数据信息只被保存一次。最近,众多厂商都相继推出了整合该技术特性的解决方案。与此同时,一些用户也开始使用这项技术来对海量数据进行管理与控制。

其他一些潜在的用户在面对五花八门的重复数据删除方案时也显得有些无所适从。在这里,专家为用户列出了以下几条建议:

1、详细了解这项技术。尽管现在关于重复数据删除技术的宣传铺天盖地,但这并不意味着这项技术适合所有用户应用。StorageIO顾问公司的分析师Greg Schulz表示:“重复数据删除并不是删除冗余数据的唯一方法。”他还说,用户可以考虑采用其他一些管理、简化数据的技术。

在这里,他特别提到Storewiz等厂商所提供的数据压缩技术。他说:“数据压缩技术的数据删除率比重复数据删除低,但是前者的数据删除率要比后者稳定的多。”所以在通常情况下,数据压缩技术的可靠性更高。

Storewiz提供的数据压缩技术不仅可以删除冗余的备份数据,而且可以删除冗余的主存储器。与重复数据20:1到50:1之间的数据压缩率相比,Storewiz的数据压缩技术的压缩率则在2:1到5:1之间(取决于数据和应用程序的类型)。

2、明确你的需求是什么。在应用重复数据删除技术之前,用户应该认真地想一想自己到底需要这项技术来实现什么目标。“重复数据删除的条件就是存在相同或者类似的信息。”Schulz这样说道,例如姓名或地址等相同的数据信息很容易被重复数据删除技术列为要删除或压缩的对象。

3、选择一个合适的、带有重复数据删除功能的解决方案。目前,各厂商在其硬件或软件产品中提供了形式多样的重复数据删除技术策略。例如,Data Domain和Quantum推出了一种专门的重复数据应用,而归属于EMC的Asigra和Avamar则推出了一种基于软件的解决方案。此外,FalconStor和Sepaton等厂商还提供了一种为删除的冗余数据创建VTL的解决方案。

DragonSlayer咨询公司的首席分析师Marc Staimer说:“我个人更倾向于将重复数据删除技术整合加入到软件产品中的解决方案,这样我就可以自己决定使用哪一款软件。”他认为VTL和基于应用的重复数据删除都是有局限性的。“它限制了操作的灵活性,也就是说,如果我采用了其他厂商提供的VTL,就会带来许多问题,”

4、Inline processing与Post processing。重复数据删除技术被分为两大类:Domain、Diligent等提供的Inline processing和由Sepaton、FalconStor等提供的Post processing。目前,只有昆腾能够在一个解决方案中既提供Inline processing技术又提供Post processing技术。

Inline processing发生在数据从备份服务器接收并存储到磁盘的时候,而Post processing通常发生在备份处理之后,避免了备份和重复数据删除之间发生冲突。目前,支持Inline processing和Post processing的两大阵营不分上下,但是又有第三个阵营表示更倾向于将Inline processing和Post processing相互整合。

虽然Post processing技术不会减缓数据备份的处理过程,但是Post processing更适合那些大型企业,因为通常这些大型企业可以为那些还没有被删除的冗余数据提供富余的存储空间。

5、提前考虑到安全问题。教育服务提供商Timecruiser的CTO James Wang认为,由于重复数据强调的是单实例存储,所以这给用户带来了新的安全问题。他说:“如果你执行了重复数据删除,数据信息的多个副本都会被删除,最后只保留一个副本,于是你就不得不格外谨慎地保留这个副本。”

之前,Timecruiser每天都会保存当天所有的数据副本,而现在它只保存其中的一部分了。为了增强安全性,Wang和他的技术小组正研究向其重复数据删除的基础架构中整合加入远程复制功能,将公司的数据信息复制到一台远地的存储设备上。

责编:
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918