NetApp 重复数据删除基础知识回顾

来源:畅享网  
2011/6/20 10:42:44
这部分的“基础知识回顾”介绍如何实施 NetApp 重复数据删除、最常见的用例、重复数据删除的实施方法等。



本文关键字: NetApp 重复删除

使用 NetApp 重复数据删除

 

表 2 汇总了运行 NetApp 重复数据删除的基本要求。

除这些要求之外,注意采用一些最佳实践也有助于成功实施重复数据删除。下面的内容汇总了一些重要的最佳实践,并提供了重复数据删除与其他常见 NetApp 技术结合使用的相关信息。有关详尽说明,请参阅 TR-3505:《NetApp Deduplication Deployment and Implementation Guide》。

•在部署重复数据删除之前,您应该在测试环境中衡量其性能影响及大小调整要求,对于 NetApp 未曾测试的应用程序(如表 1 所列程序之外的程序)尤其如此。

•重复数据删除会占用系统资源,还会更改磁盘上的数据布局。由于应用程序的 I/O 模式和重复数据删除对数据布局的影响,读写 I/O 性能也会发生变化。空间节省和性能影响取决于应用程序和数据内容。

•如果应用程序仅创建少量的新数据,则不宜经常运行重复数据删除,因此在这种情况下,频繁运行的好处微乎其微。重复数据删除的运行频率取决于灵活卷中的数据更改率。

•运行的并发重复数据删除扫描进程越多,占用的系统资源就越多。最好的办法可能是采用以下做法:
错开灵活卷的重复数据删除计划,隔日执行重复数据删除进程,从而降低运行过多并发进程的可能性。
使用自动模式,仅当写入每个灵活卷的数据明显增加时才运行重复数据删除。(在较小型的环境中运行重复数据删除时,这样做易于自然而然地错开高峰。)

手动运行重复数据删除

每晚运行重复数据删除,最大限度地减少要执行重复数据删除的新数据量,这样完成操作所需的时间较少。

•如果在重复数据删除操作完成之前创建了 Snapshot副本,则可能导致节省的空间减少。如果可能,应在创建 Snapshot 副本之前执行重复数据删除操作,确保首先完成重复数据删除操作,然后再创建 Snapshot 副本。

•为了正常运行重复数据删除,需要为重复数据删除元数据留出一些可用空间。对于 7.3 之前的 Data ONTAP 版本,每个灵活卷应留出总数据可用空间的 6%。对于 Data ONTAP 7.3 或更高版本,聚合应该为重复数据删除所作用的所有灵活卷留出总数据可用空间的 4%(指纹 + 更改日志),每个灵活卷应留出总数据可用空间的 2%。详细内容在 TR-3505 的第 5.3.3 节中介绍。

重复数据删除与其他 NetApp 技术

重复数据删除可与其他 NetApp 技术结合使用。在许多情况下,重复数据删除能够进一步提高以下技术的性能:

•闪存。闪存提供智能缓存,可加快 I/O 操作。NetApp 重复数据删除可提高缓存命中率。如果闪存中存在经过重复数据删除的块,再次请求此块的几率要高得多。这种效应称为“缓存放大”,对服务器和桌面虚拟化特别有用。

•卷 SnapMirror。使用卷 SnapMirror 复制经过重复数据删除的卷时,目标卷自动从源卷继承经过重复数据删除的状态。这种效应对 VMware 的影响在之前的文章中有所介绍。重复数据删除与所有形式的 SnapMirror 及 SnapVault 的交互作用也在近期的文章中有所介绍。

•FlexClone。FlexClone技术可以将数据卷和数据集即时复制为透明的虚拟副本。创建 FlexClone 卷时: 如果父 FlexClone 卷启用了重复数据删除,新卷会继承节省。

克隆卷继承父卷的重复数据删除配置,如重复数据删除计划。

从 Data ONTAP 7.3 开始,不再克隆重复数据删除元数据文件(指纹数据库和更改日志文件),因为它们位于聚合中的卷外部。必须在克隆卷上启动重复数据删除,才能继续执行完整的重复数据删除。

•数据压缩。NetApp 数据压缩在 Data ONTAP 8.0.1 中推出,是对重复数据删除技术的有力补充。可能的空间节省和用例在之前的 Tech OnTap 文章中有所介绍。

•精简配置。重复数据删除还可与 NetApp 精简配置结合使用,最大限度地提高空间节省。对于 NAS 卷,配置非常简单。对于 LUN,可使用以下设置(有关详尽说明,请参阅 TR-3505 的第 6.4.18 节)最大程度地节省空间:

“LUN space reservation value”(LUN 空间保留值)设置为“off”(关)
“Volume fractional reserve value”(卷保留百分比值)设置为从 0 到 100 之间的任意值
“Volume guarantee”(卷保证)设置为“none”(无)
“Snap reserve”(快照保留)设置为“0%”
“Autodelete”(自动删除)设置为“on”(启用)
“Autosize”(自动大小调整)设置为“on”(启用)
“Try_first”设置为“volume_grow”

结论

重复数据删除是重要的存储效率工具,可单独使用,也可与 NetApp 精简配置、FlexClone 等其他存储效率解决方案结合使用。要了解有关重复数据删除的详细信息,请务必参阅 TR-3505:《NetApp Deduplication for FAS and V-Series Deployment and Implementation Guide》。该指南经常更新,涵盖大量主题,包括:

•配置和操作
•针对性能和空间效率的大小调整
•与其他 NetApp 技术的结合使用
•最佳实践包括与 VMware、Microsoft Exchange、SQL Server 及 SharePoint、Lotus Domino、Oracle 等特定应用程序的结合使用
•故障排除

Carlos Alvarez  NetApp高级技术营销工程师

Carlos 于 2008 年加入 NetApp,专门从事存储效率的研究,在重复数据删除、数据压缩和精简配置领域拥有深厚的专业知识。他经常提供将最有效、最合适的 NetApp存储效率技术集成到客户配置中的相关指导。Carlos 拥有二十余年的从业经验,曾受邀编写过大量的实施指南、技术白皮书、参考架构、最佳实践和解决方案指南。

共2页: [1]2 下一页
责编:杨雪姣
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918