MapR加入EMC大数据 拥抱新的Hadoop分布式平台

来源:ZDNet存储频道  
2011/5/27 13:03:21
MapR科技与数据存储和安全巨头EMC在5月25日披露了一个新的软件授权协议,并在EMC的新Apache Hadoop分布式系统中加入它的知识产权。



本文关键字: MapR EMC Hadoop分布式平台

MapR科技与数据存储和安全巨头EMC在5月25日披露了一个新的软件授权协议,并在EMC的新Apache Hadoop分布式系统中加入它的知识产权。

座落于加州圣何塞市的MapR将会成为EMC Greenplum HD企业版的一个重要组成部分,它实现了对Apache Hadoop软件堆栈的100%的界面兼容。新的装置将为预集成和测试分布系统使用MapR技术的集群IP。

由以前的苹果公司、Xerox PARC和雅虎资深开发者Doug Cutting创建的Apache Hadoop,是一个建立在Java上的开源软件架构并使用分布式加强数据应用来工作。它使得应用能够安全的扩展以便可以处理无数的节点和PB级数据。

尽管一些Hadoop分布式系统是可用的,但它们无法处理所有的单点故障问题,缺乏快照功能、缺乏镜像功能以及性能低下,这些都是为何要将MapR推上台面的原因。

MapR的功能概述

MapR的CEO John Schroeder对eWEEK透露了一些关于MapR的功能,其中包括:

对网络文件系统(NFS)的直接浏览,允许用户使用NFS协议来简化加载以及直接在Hadoop集群中浏览数据,允许标准工具和实用程序直接运行在包含于Hadoop中的数据上。

Heatmap用户界面提供全部的集群可视性与控制。

所有的单点故障不会出现在Hadoop 堆栈中。

JobTracker HA(高可用性)能够确保连续执行作业。

带有高可用的分布式的NameNode(命名节点) 解决主要的可靠性问题的同时,也提高了性能和扩展性。

快照允许对时间点数据的保护和恢复。

维持企业工作连续性的镜像包含大范围的复制支持。

Evaluator Group 的高级分析师John Webster指出“这对每位Hadoop用户来说是一个重要的进步。MapR的创新与EMC的大数据分析能力和服务相结合,将会允许更多的人来使用大数据分析的能力。使得出现实质性的市场增长。”

“MapR已设法在性能、降低成本、可靠性和易用性上得到改进,这标志着Hadoop的市场将发生重大的改变。”

Hadoop受到Google's MapReduce的启发

目前在Cloudera担任Apache 软件基金会的主席Cutting曾表示:Hadoop受到过Google's MapReduce和Google文件系统的启发,MapR使开源软件MapReduce实现了商业化。

以Cutting儿子的大象玩具来命名的Hadoop,不断的被全世界各地的参与者所维护和改良,其中作为Hadoop的初始推动者之一并正在赞助一个Hadoop开发者会议的雅虎公司,已拥有为此项目服务的大量参与者并广泛的使用Hadoop来应用于自己的业务当中。

Webster指出:“在从传统数据仓库转换到大数据分析的过程中,Hadoop起到了主导的作用,EMC的Hadoop商业化战略旨在为企业级用户精简并强化Hadoop,使得Hadoop更多程度上成为企业必须具备的实时分析工具。”

 

责编:张欢
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918