|
大数据时代:存储选择变幻莫测对于在大数据环境下的存储来说,“云”似乎是一个很流行的选择。 随着企业级大数据存储需求的不断增加,存储厂商和系统管理人员都需要确定在大数据环境下的最佳实践是怎样的。因此,我们看到有越来越多像是Hadoop和“云”之类的东西。但根据Toigo Partners International的最主要的合作伙伴Jon Toigo的看法,这些方法并不是大数据环境下最好的。 在该播客中,Toigo与网站编辑助理Sarah Wilson就大数据环境下的存储市场变革进行了讨论。收听音频或阅读下文中的对话内容,了解他关于大数据环境下存储、云、备份和容灾如何进行调整的观点。 你认为存储市场会如何发展以更好地适应大数据? Jon Toigo:好的,我认为大家会看到两种不同的趋势。其中之一是Hadoop与大数据已密不可分。我们说的是Hadoop集群。关于这一点基本上业界抛弃了共享存储——SAN(存储区域网络)和NAS(网络附加存储)——更倾向于使用直连存储(DAS),尤其是使用闪存的DAS。IBM已经登上了舞台,他们存储部门的主管强调说,“我们认为闪存是所有存储的未来。”于是他们推崇基于闪存的存储,直连到集群上作为大数据分析的数据存储介质。我不晓得这是不是解决问题的最佳方案,但我认为这样会花掉一大笔钱。它回退到1999年以前的存储架构,它再次引入了几十年前我们有过的两个问题,忽略了存储孤岛上的数据保护问题。你将不得不进行节点间的复制以确定存储孤岛间提供保护所需要的带宽。然而,考虑到存储销售额放缓的一般趋势,这样做的确会卖出更多的设备,是业内人士希望看到的。 另外一种趋势是以整体的视角看待这个问题。客户会说,“过去十年里我们一直在部署共享存储,部署光纤通道架构。我们跟随着科技进步的方向,无论是用InfiniBand或SAS或者下一代新技术。为什么我们要花十年把这些搭起来,然后又把他们分开拆掉?”这样做没什么意义。你看像是DataCore Software这样的公司,或者一些使用SAN卷控制器的IBM的产品,以及其他人在试着对存储做虚拟化,从而向服务器提供虚拟卷,就像这些服务器直连存储一样。这样做会更有意义,能整体地管理与存储相关的所有设备。这方面我认为还有很多事情要做,而不是把存储分开,为服务器添加直连存储。并且我认为,最终我们会到达后一种模型。 对于在大数据环境下的存储来说,“云”似乎是一个很流行的选择。你认为云提供商是否在调整他们的服务以更好地适应大数据? Toigo:正如你知道的,我对云的目前发展有些迷惑。总体来说我不是一个典型的云技术推崇者,但是,我们认为这可能是云发展过程中较好的模型之一——应用于云的可持续业务模型,即为承载大量特定类型的数据进行定制的云。就此我咨询过专家。我问IBM的Jeff Jonas,由云服务提供商来搭建一个大数据是否有意义,是否这样我就不必自己买基础设施了?我认为对于一个不想去花大笔钱来买支持Hadoop的基础设施的公司是有意义的,对于他们Hadoop上的业务分析项目可能只用一回,或者频率很低,就像选民登记分析。为什么你会搭建一个几百美元的基础设施来分析数据的某一方面之后就回家并简单地关掉它?至少对我来说没什么意义。 Jonas对这个观点不太同意,我对此有些迷惑不解,他解释了自己的观点。他说定位云中的数据需要大量时间,访问云中的数据需要付费带宽,与数据和云相关的初始安全问题、弹性问题,以及一些云运维其他方面问题,导致云不是托管大数据分析所需数据的最佳位置。 责编:王雅京 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 |
|