英特尔:相同的大数据不同的Hadoop

来源:中关村在线  
2013/2/27 11:26:59
海量数据的时代正在到来,在这种环境下,需要有新的技术手段来应对大数据带来的挑战,并充分挖掘其潜在价值,实现业务的进一步发展和保持企业的竞争优势。作为半导体领导厂商,英特尔拥有完整的涵盖软硬件平台的大数据解决方案。

本文关键字: 大数据 Hadoop

海量数据的时代正在到来,在这种环境下,需要有新的技术手段来应对大数据带来的挑战,并充分挖掘其潜在价值,实现业务的进一步发展和保持企业的竞争优势。作为半导体领导厂商,英特尔拥有完整的涵盖软硬件平台的大数据解决方案。

根据IDC预测,全球的数据使用量到2020将将会增长44倍,达到35.2ZB(1ZB=10亿TB)。Facebook、Twitter、微博等各种社交平台的海量数据,以及视频通讯、医疗影像、地理信息和监控录像等视频内容也会极具增加,加之传感器、RFID阅读器、导航终端等非传统IT设备和移动设备,都将产生越来越多的数据。增加的这些数据当中,有80%的数据属于非结构化。

面对这些巨变,传统的IT技术并不足以应对这种新挑战,传统的关系型数据库以及桌面BI分析软件处理的结构化数据,其容量一般都在GB级别,无法从更大的数据集中发现有意义的信息。另外,需要处理的目标数据也一直在增长,传统技术无法适应这种扩展性。

那么,究竟什么样的技术和解决方案才能胜任这种挑战呢,我们认为,适合大数据时代需求的解决方案,一般要具备以下条件:

支持PB级别数据的处理和分析

支持结构和非结构化数据

支持万级每秒数据查询

支持高可靠性系统

支持高频率统计分析

也就是说,对于大量的结构化和非结构化数据,支持可变的数据结构和高效的数据导入、查询、统计分析。作为引领服务器发展方向的英特尔来说,目前它拥有在Apache开源版基础上修订的发行版和免费版两个Hadoop版本,并在GitHub维护着Project Panthera开源项目,其中包括即时分析、基于HBase的文档存储、基于Hive/MapReduce的分析SQL引擎、HiBench和HiTune等子项目。

英特尔Hadoop发行版组成

为何谈大数据的时候我们要重点谈Hadoop呢?因为Hadoop是目前为止大数据解决方案的主流平台,也是顺应未来大数据和云计算环境的平台。接下来,我们将为大家介绍英特尔发行版Hadoop在应对大数据挑战方面的独特优势。

责编:赵龙
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918