什么是Hadoop?

来源:CIO时代网   
2012/12/25 16:00:41
处理海量数据大数据的技术,现今最火红的则非Hadoop莫属了喔!

本文关键字: Hadoop 大数据

处理海量数据大数据的技术,现今最火红的则非Hadoop莫属了喔!

根据Hadoop的创办人Doug Cutting所言“Hadoop”就只是帮一只黄色的填充大象取的名字而已,没有什么特别的意思纯粹只是好记而已。而Hadoop技术的诞生则是因为因特网数据的爆炸性成长,传统的文件系统无法负荷储存跟分类,从而根据Google搜寻器的相关的学术论文为蓝图,演变成一套如何储存、处理、分析TB(Tera Bytes)甚至PB(Peta Bytes)等级的数据处理方法。

Hadoop是百分之一百免费由Java程序语言所编写的Open Source,一种从根本结构上与现存技术不同且先进的储存、处理、分析海量数据的技术,执行Hadoop使用者无须仰赖昂贵的或是具有专利的软硬件平台,Hadoop可以在便宜且工业规格化的服务器群上执行平行数据处理以及分析,有了Hadoop没有什么数据量是过大的,在现今资料量爆炸的时代企业、学术、政府等组织可以利用从之前被认为是无用的资料找出从来没被发现的参考价值。

Hadoop基本上可以处理任何数据型态,不论是结构化或是非结构化,log纪录文件、照片、声音、通讯纪录或是电子邮件。不管是什么数据你都可以汇入HadoopCluster并且不用作任何前处理,它就会帮你回答你从来不曾想过的问题!Hadoop把看似毫无关联的资料背后所隐含的讯息呈现出来,用户便可以根据更多的参考资料做出对应决策了。

 

责编:chrislee2012
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918