WAFS:数据集中 远程存储

  作者:Amteam.org
2006/7/31 1:22:00
本文关键字: 存储 虚拟化

【51CTO.com综合报道】几年前,Steve McCanne博士在美国Berkeley大学教授期间,提出一个大胆的设想——把LAN(局域网)与WAN(广域网)区分开来。

McCanne博士为什么会有这样的想法呢?原来,广域网在设计之初并没有为远程文件服务做过多的考虑。随着广域网的发展,越来越多的问题体现出来:一个是带宽,一个是可靠性,还有延迟。这三方面都是WAN无法很好解决的,在为用户提供远程的数据服务,特别是文件服务时效率十分低下。于是McCanne博士这样的学院派科研人员就郑重建议:将LANWAN区分开来。

这种想法很好,但是从工程实现上太过复杂,而且成本会是一个天文数字。于是,许多科研人员早在几年前就着手研究优化WAN的事情,一些新兴厂商纷纷投入研发相关产品。如今,这些想法已经变成了现实,这就是最近颇受关注的WAFSWide Area File Services,广域文件服务)。

WAFS市场最先是由行业分析机构Taneja Group定义的。这个市场的出现主要是为了满足维持分布式运营的企业的需要,因为在分布式运营中,众多用户需要跨多个位置互动。远程办公室中昂贵的基础设施迅猛增加的费用以及海外开发、企业整合和企业扩展进入世界各地新的机会领域的需要,推动广域文件服务迅速发展。

根据不完全统计,目前全球有超过12万家分布式企业和4百多万远程办公室。这些用户急需改善远程办公室性能和可靠性,从而实现在企业范围方便地实时文件共享,这些都是广域文件服务可以大展身手的巨大市场。

WAN文件服务面临三大难题

延迟   在广域网上保存或打开每一个文件都可能用去长达数分钟的时间,有时甚至无法顺利完成操作。在广域网上打开或保存一个基本文件的操作可能包含数千个单个的广域网“往返”通信过程,即所谓的远程过程调用,简称RPC。由于广域网延迟造成的网络延迟比局域网的访问时间要高得多(通常要大二至四倍),但像CIFS(通用Internet文件系统)和NFS(网络文件系统)之类的文件共享协议根本不可能对付高延迟的网络环境。每一次由CIFSNFS协议在广域网上造成的“往返”通信都会造成较高的延迟,并对性能产生巨大的影响。随着广域网上两点间距离和网络争用的增大,网络中也会出现更大的延迟,而且问题也会随之加剧。

缺乏可靠性   处在打开和保存进程中的文件数据很可能会无限“超时”。新修改的文件也有可能在这一过程中无缘无故地消失。广域网的可靠性天生就比局域网连接要差许多,经常会发生包丢失的情况,有时甚至会出现网络中断(尤其是使用卫星或微波连接技术)。

低带宽   低网络带宽在远程访问文件时可能会产生让人难以忍受的低速。这可能会导致远程用户采用一些折衷的办法,将这些原本应当位于中心服务器上的文件复制到本地的文件共享位置或目录中,并对其进行编辑。这些折衷的办法会在未来产生很多问题,例如同一文件会出现多个版本,而且冗余的数据会分散到整个企业中,很难对其实施有效的管理。通常性能下,企业分支办公地点所采用的广域网带宽可能比局域网带宽要低10100倍,主要的连接方式为T1DSL或帧中继连接,而这些连接基本上可以满足远程文件请求的要求。如果要在在广域网连接上增加VPN和其他网络层,则有可能会进一步降低广域网的带宽。

WAFS工作原理

为了解决上述难题,WAFS产品应运而生。典型的WAFS架构包含两个组件:一台位于主数据中心内的WAFS服务器设备,以及位于远程办公地点的一台或多台远程设备。每台WAFS设备都可以通过CIFSNFS等标准协议与现有的远程客户端PC机和文件服务器实现通信,并且使用为广域网优化的定制协议实现这些设备之间的通信。利用这些定制的协议和优化技术,WAFS能够消除多余的广域网往返通信,即RPC,而这些RPC正是广域网延迟问题背后的罪魁祸首。

23.gif

在数据中心内,WAFS服务器设备看起来就像是安装在主站点内的共享式网络连接存储(NAS)设备的另一台客户机,用户则将远程WAFS设备看作是带网络文件共享功能的NAS设备。WAFS解决方案可以通过很多方法解决广域网的三大问题,即延迟、网络可靠性和低带宽。最佳的WAFS设备通常会执行非常复杂的读/写缓冲算法,并且使用数据压缩和数据流技术,从而使用户和文件都不会受到多数常见广域网问题的影响。一些WAFS系统还可以执行分布式的文件锁定功能,进一步保证数据的完整性和连贯性,也就是说,用户只能查看和编辑中心服务器提供的最新版本。通过将这些技术和方法结合在一起,我们就可以有效地将广域网变成一个全球局域网,全世界的员工都可以随时访问和使用相同的文件。

WAFS带来五大好处

综合看来,WAFS可以从以下几个方面为用户带来巨大好处。

1.替换或减少现有的远程存储服务器、硬件和软件

一台WAFS设备可以替代多台远程文件服务器、远程备份硬件(磁带驱动器等)、备份磁带、备份软件、管理软件DNS/DHCP域名服务器、Web缓存服务器、打印服务器、服务器相关的操作系统授权/升级保护计划,以及与服务器有关的杀毒软件授权。这些都有助于将远程存储孤岛与主数据中心合并起来。

2.对所有的企业数据形式实施更加集中的管理。

为远程办公地点提供更快、更全面的数据保护和业务连续性保障,更忠实地执行法规遵从标准,IT工作人员不需要监视远程备份和远程服务器硬件或软件升级过程。此外,由于企业不再需要依赖远程办公地点的文件存储能力,WAFS还使企业能够简化与远程办公地点有关的法规遵从战略,并确保更高的数据可用性。由于边缘数据都实现了集中管理,IT部门还可以实施更为广泛的基于策略的管理和存档。

3.减少与远程办公地点有关的IT基础设施并降低其维护成本。

由于WAFS设施不再需要远程IT运营,因此就可以大幅度地节省IT人力和差旅成本,同时远程系统所消耗的电力也会大幅减少。这些办公地点还可以取消许多远程硬件和软件维护合同,为企业进一步降低运营过程中的成本。

4.大幅度提高远程用户的生产效率。

许多远程用户已经习惯于通过广域网访问文件时长时间等待,但现在,他们却可以获得近乎局域网的文档和文件访问能力,整个过程俨然就像是通过企业内部的局域网实现的访问。

5.通过全球文件共享改善协作。

对于那些需要密切协作的关键行业而言,例如需要生产详细的CAD设计图纸的行业,WAFS使不同公司、不同地点的小组成员能够更快捷地更新文件的内容,并且在同一份文件上协同工作。负责实施WAFS的企业IT部门还可以更从容地将广域网转变成为一个统一的、全球局域网,并在全球范围内实现数据的实时共享。

WAFS有别于WAN加速器

记者在采访中遇到这样的情况,许多厂商和用户的工程师对WAFS和广域网加速器的概念混为一谈。当然他们对两者模糊的概念是可以理解的,原因在于他们采用的主要技术以及解决的问题有很大一部分是相同的,但是,他们的区别也十分明显。WAFS的主要目的是进行存储与服务器的整合进而为用户节约宝贵的存储空间,而WAN加速器则侧重在减少广域网投资以及有效利用昂贵的带宽资源。两者都能够进行有效的远程数据传输。

WAFS与WAN加速器比较列表
技术
主要目标
各自特点
WAFS
以局域网的速度在广域网中进行数据传输;
服务器与存储设备的整合
多站点之间的复制与缓存要确保一致;
虚拟磁盘要尽量避免宕机
WAN加速器
改善广域网性能;
能够降低广域网开销或者有效利用带宽
丢包不会对服务造成影响;
速度稍慢于WAFS;
没有服务器和存储设备的整合

用户要考虑的八大因素

在拿到一些厂商的产品资料后,记者发现,它们都宣称了很多优势,而仅从这些文字上很难区分出这些产品的区别,于是记者归纳了下列八大问题,相信用户在得到所有这些问题的答案以后,对选择WAFS产品就会更加充满信心。

1. WAFS的性能

WAFS解决方案应当能够在广域网上展示出类似局域网的连续操作能力。有关性能方面的典型问题包括:通过广域网打开/保存单个文件时的性能如何?处理巨大文件时的性能如何?处理元数据或CIFS/NFS目录列表时的性能如何?打开和保存“冷”文件和“热”文件时的性能如何?系统使用什么机制或算法来减少通过广域网发送的数据量,以及在完成保存或打开操作时远程过程调用所需的数据量?该解决方案在面对用户企业所使用的多数文件类型时性能如何?该解决方案是否能够以相同的方式处理所有的文件类型?

2.系统可靠性和灵活性

广域网历来就容易发生通信中断,而且连接的质量也较差,从而导致网络连接的性能受到严重的损害。下述问题可以帮助您确定WAFS系统在面对广域网问题时的性能到底有多高。它们还可以帮助判断WAFS厂商到底采取了哪些措施来应对形形色色的故障:为了确保远程用户的操作或文件不受影响,WAFS系统是如何处理广域网中断或连接质量不佳问题的?当WAFS主服务器的连接中断时,远程用户是否仍然可以访问远程文件?如果能访问的话,到底是怎样实现的?当广域网发生中断时,在广域网上正处于打开或存储状态下的文件会受到哪些影响?文件缓存或压缩功能能够在多大程度上改善系统在广域网故障后的恢复能力?这一功能与其他厂商的产品功能有多大的差别?如果WAFS硬件中的某个组件发生故障,系统可以提供哪些安全功能来确保正在执行的访问不受影响(如群集能力、RAID功能、快速故障切换支持等)?

为了应付广域网中断事故,WAFS厂商采取了多种多样的方法,完全有能力确保用户在广域网上打开、关闭或保存文件时不会丢失的数据。

3. 数据完整性

当多个用户通过广域网在多个地点共享同一文件时,他们最关心的就是数据的完整性。总之,WAFS解决方案必须能够确保所有的文件都是最新版本的,而且不能被多个用户同时编辑。下面提供的便是这方面值得考虑的几个问题:系统怎样才能确保所有的地点都能连贯地查看数据?系统使用哪些文件锁定机制来确保每次只有一个用户可以对文件进行编辑?当某人正在编辑一个文件时,其他用户是否可以从多个地点查看该文件?如果能,这种作法是否会降低文件访问的性能?如果某个远程用户在打开和使用一个文件时发生了网络中断或停机事件,系统是通过什么方法来防止文件受损的?

4. 数据安全性

由于文件访问发生在企业的边缘位置,WAFS系统需要具备内建的安全特性才能确保只有那些真正需要访问这些文件的用户获得访问权。它们还需要为那些在广域网上发送的数据包提供足够的安全障碍。安全方面的问题主要包括以下几条:WAFS解决方案采用的是哪些类型的加密技术?用户已经为企业环境中的某些文件实施了基于角色的访问控制,WAFS系统支持这类访问控制规则的性能如何?安全规则是通过集中的WAFS服务器来管理还是需要用户同时利用远程WAFS设备来协同管理?当用户需要访问文件时,WAFS系统是如何帮助企业对用户实施验证和授权的?这一过程是否是自动的?这一过程发生地点在哪里?为了达到跟踪文件访问模式的目的,WAFS系统提供哪些类型的日志或审查功能?

5WAFS的扩展能力和扩充能力

在讨论WAFS的时候,很多用户都对一个问题非常感兴趣,即是否有哪一种解决方案能够不断扩大,容纳更多的并发远程用户和更多的远程站点。用户还必须了解WAFS解决方案是否能够扩展并超出其最终的集中文件共享和合并用途。在这方面,以下的几个问题值得参考:利用WAFS解决方案可以将多少远程站点合并到数据中心?换句话来说,一个集中WAFS服务器可以支持多少个远程站点?当向WAFS系统添加远程站点时,是否需要在数据中心里针对每一个办公地点或每一种文件添加额外存储资源?使用WAFS可以将多少远程站点合并到数据中心内?远程办公地点访问数据中心内的共享式存储资源时是否存在访问量方面的限制?WAFS系统可以在某个远程站点中支持多少位并发用户?由于WAFS系统可以替代其他的远程服务器,那么它是否能够支持其他的分支办公地点服务,如打印服务、Web缓存服务、管理服务或DNS/DHCP服务?

6.集成和协议支持

任何一种强健的WAFS解决方案都能够与所有主要操作系统平台使用的文件传输协议建立完美的通信。这方面的典型问题包括:该系统支持LinuxWindows环境的文件访问能力如何?该系统采用了哪些技术来集成现有环境中的CIFSNFS协议?在Windows环境中,WAFS系统(通过NetBIOSWNSDNS)支持域名解析功能的能力如何?该系统支持SMS(系统管理服务器)和活动目录的能力如何?

7.系统管理和易用性

WAFS系统在管理方面的易用性也是评估的关键因素之一。因此,在评估过程中应当考虑到以下几个问题:系统安装过程是否简便?系统需要执行哪些日常管理功能?实施这些功能需要多长的时间?该系统是否可以为所有远程WAFS设备提供集中管理的控制能力?如果可以提供,那么在远程办公地点一级需要哪些管理能力?这些集中WAFS系统与数据中心内可能用到的大型系统管理工具(如IBM/TivoliHP OpenView,和Microsoft SMS等)的集成能力有多好?在Microsoft Windows环境下,WAFS系统与Active DirectorySMSMicrosoft Management ConsoleMMC)和Microsoft Operations ManagerMoM)等Microsoft管理工具的集成能力有多强?

8.实际应用测试

在考量完上述7个方面以后,用户基本上可以对WAFS产品有了整体了解。记者建议,在购买之前,还应该结合自己的实际应用环境测试一番。比如,厂商在向用户兜售WAFS产品时一般都有一些漂亮的测试报告。而长期的测试经验告诉记者,这些测试结果都是在特定的测试环境下得出的,某些测试样本的微小调整或者用户应用的特殊性都会使得具体的实际工作性能发生巨大的变化,用户在实际试用一段时间后会得到最具有说服力的结果。

尽管WAFS对广域网没有任何实质性的改变,但是通过WAFS产品所进行的远程文件服务却发生了根本性的变化。经过多年的发展,目前的WAFS产品(大概是第四代产品)已经基本成熟。而过去几代产品也经历了由分布到集中的转变,前几代WAFS试图(一般都没有成功)实现一种全面分布的数据模型。目前几乎所有产品都转而采用集中存储,大大减少了支持远程用户所需要的软件和硬件。

单独的WAFS产品价格并不高,但是用户不能把WAFS当作一个孤立的产品看待,只有把它融入到更加全面的数据中心整合的解决方案中才能够发挥更大作用,为用户带来更好的投资回报。因此,不论是为用户提供远程文件共享,还是能够进行服务器与存储设备的整合,WAFS越来越不像一个简单的单一产品。通过各个厂商推广的模式来看,大家普遍是通过提供整体解决方案的方式进入市场。

目前有一些厂商推出了WAFS产品,而它带来的更广泛的存储整合可能才刚刚开始,对用户原来已经习以为常的备份、容灾等日常存储工作都有可能产生重大影响。举个例子来说,在没有WAFS之前,用户进行远程备份的工作具有很大挑战,需要面对许多带宽、延迟难题,而部署WAFS产品之后,就会大大减少远程传输的数据量。类似提升存储网络价值的优势可能在用户部署WAFS产品之后更多显现出来。

WAFS动态

■ 博科:关注共享存储

近期博科推出Tapestry系列产品,关注点从以前SAN网络设备扩展到范围更广的共享存储环境。除了WAFS产品,博科Tapestry系列产品还包括ARM(应用资源管理)以及DMM(数据迁移管理)。博科WAFS产品可以通过WAN实现LAN速度的文件传送,缩短WAN上文件传输所消耗的时间,WAFS已经取得了微软的认证,而且已经得到了市场的认可。

博科是通过与WAFS著名厂商Tacit的合作得到的WAFS产品,此外,博科对Tacit还进行投资。那么博科将来会不会收购Tacit呢?当记者就该问题询问博科副总裁戴博·达塔时,得到的回答是“时间会告诉我们答案”。

McDATANAS也可互联

McDATA有很大一部分客户都是大型数据中心,他们除了有SAN互联的需求,在NAS远程互联方面同样存在需求。

McDATA中国区技术经理雷涛介绍说,在大型用户数据容灾应用时,有些日志文件、配置文件的复制工作,在原有情况下是通过专业服务(比如人工编制脚本)实现的,而在进行高级业务连续性方案中,通过WAFS以及其他相关远程文件服务,可以使得远程数据容灾就像本地的灾难恢复一样。

McDATA透露,在未来一两个月内会发布WAFS产品,而且不仅仅局限在WAFS方面,还包括一系列远程数据服务相关解决方案。

RiverBed:提供广域数据服务

RiverBed公司大中国区总经理王国兴介绍,与其他一些只有WAFS产品的厂商不同,RiverBed的解决方案既包括了WAFS产品,还包含了广域网加速器的功能,因此能够为用户提供远程数据服务。通过优化广域网的交互方式,RiverBed Steelhead系列产品能改进广域网应用性能,从而实现将绝大多数远程办公室的IT设备集中整合到一个统一的数据中心里,帮助用户实现所谓的“无服务器办公室”。

■ 思科:联手EMC

思科去年6月份通过8200万美元收购Actona公司而进入WAFS领域,今年初,思科正式宣布成为EMCNAS产品合作伙伴,表示思科将代销并支持EMCCelerra NAS产品。近日,思科宣布,将把其广域网文件服务引擎WAFS应用整合到EMCNAS系统。

显然,思科意识到WAFS产品对整合用户NAS的重要性,因此与目前NAS产品市场份额第一的EMC合作对其开展WAFS业务会有很大的促进作用。


责编:
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918