Hadoop的五大误区
——反思HADOOP成功部署的普遍误区,激发HADOOP技术的全部潜力

来源:《TERADATA杂志》  作者:BRETT MARTIN
2014/9/28 13:13:56
Apache™ Hadoop®助力企业应对他们最艰难的挑战之一——利用海量数据创造价值。用户普遍部署Hadoop框架,是因为它能够帮助企业从各种不同类型的大数据中获得价值。

本文关键字: Hadoop 浪潮 大数据
Apache™ Hadoop®助力企业应对他们最艰难的挑战之一——利用海量数据创造价值。用户普遍部署Hadoop框架,是因为它能够帮助企业从各种不同类型的大数据中获得价值。独立分析机构Forrester Research公司发布的《Forrester浪潮:大数据Hadoop解决方案》(2014年一季度版)报告显示,Hadoop的开源架构逐渐深入适应企业环境,其疯狂的发展势头已无法阻挡。其全新独特的数据管理方案正在帮助企业变革大数据存储、处理、分析及共享的方式。
 
不断发展的HADOOP技术
 
依托其技术优势,Hadoop已荣膺多项大奖,但与此同时,与其真正所能提供技术能力相悖的错误消息及过度承诺也困扰着这项技术。在部署Hadoop技术时提出不切实际的预期需求或误入技术认知误区,将导致浪费时间,费用上涨,业绩乏善可陈。
 
了解Hadoop技术能力与限制,并相应制定安装计划,将在未来充分发挥Hadoop技术能力。了解Hadoop技术的真相,并避开以下常见误区,将帮助您顺利部署Hadoop:
 
误区一:Hadoop可替代数据仓库
 
真相:Hadoop框架自身不是完整的数据或分析解决方案,也不是用作或替代数据仓库的框架或平台。就其自身而言,依托Hadoop技术开发高成本效益的大数据平台解决方案,与其它数据库共享信息,使其成为数据仓库的完美组合。依托Hadoop技术,企业将能够通过新的途径充分利用各种类型的海量数据。
 
误区二:Hadoop技术昙花一现
 
真相:Hadoop倍受青睐,其发展势头看上去势不可挡,因此,它不会昙花一现。《Forrester浪潮:大数据Hadoop解决方案》(2014年一季度版)报告称,Hadoop框架是大型企业必备的数据平台,是未来任何灵活数据管理平台中最重要的组成部分。为充分利用Hadoop的技术优势,下一代数据仓库将与Hadoop技术更深入地整合,管理规模更大,结构更复杂的数据集。
 
误区三:Hadoop技术是免费的
 
真相:Hadoop的确是一套开源产品,所有用户均可免费下载。但使用该技术却并非免费,甚至需要更高的成本。高效运用Hadoop技术需要接受严格培训的专业人士,而长期存储数据亦需要高昂成本。考虑分析及多用户因素,Hadoop技术的成本实际上要高于数据仓库。除开源技术外,厂商还销售支持各种功能的专用应用程序,支持并拓展Hadoop使用范围,为企业提供更多帮助。
 
误区四:Hadoop解决方案是一款数据整合工具
 
真相:Hadoop实际上是专为特定数据类型及负载设计的分布式文件系统。但该技术缺乏数据整合能力。如果Hadoop解决方案未能与大型数据管理生态系统结合使用,它将会成为另一个使信息相互隔离的数据孤岛。一旦在数据仓库环境下部署Hadoop技术,用户即可查询数据仓库及Hadoop中的信息。
 
误区五:Hadoop是单一的开源产品
 
真相:Hadoop是产品库及技术库,包括Hadoop分布式文件系统、MapReduce、Pig、Hive、Falcon、Knox等。多家厂商开发Hadoop产品,并加入具有差异化优势的功能。例如,Hortonworks®数据平台帮助企业采集、处理并共享任意格式、任意规模的数据。并不是所有Hadoop产品都是开源的。Forrester报告称,对Hadoop产品的需求使厂商面对竞争残酷的市场,他们需要抓住一切机会销售他们特有的Hadoop解决方案。
 
释放HADOOP技术的全部潜能
 
Hadoop为大型数据集存储及处理提供可靠的解决方案,帮助企业克服以往数据使用成本高、数据结构复杂的困难,高效利用各种类型的海量数据。虽然Hadoop技术用途广、优势多,但它却无法取代数据仓库或数据整合工具。而通过与其它数据或分析解决方案整合,反而能够提升Hadoop技术的价值。
责编:李玉琴
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918