|
Hadoop发行版厂商星环发布TPC-DS评测结果大数据基础技术领域中Hadoop的地位已获得广泛认同,但目前国内外市场上的Hadoop版本也是林林总总,到底该参照什么标准来考评Hadoop,尤其是给企业应用的Hadoop发行版平台呢? 另外,在和开源的Hive执行效率相比中,Inceptor 3.4能够带来1__0x~10__0x的性能提升。下图是TPC-DS的部分query在Inceptor和CDH Hive的性能提升倍数,其中最大的提升倍数竟可达到123倍。需要说明的是,这里用的Query跟Impala运行的相同。 更多详细的性能比较以及TPC-DS的测试配置和细节可以参考星环发布的性能白皮书。 测试小结 通过Transwarp Inceptor和Cloudera Impala在TPC-DS案例上的对比,我们不难得到如下结论: Transwarp Inceptor在SQL支持度上远胜于Cloudera Impala,应用迁移成本更低。 Transwarp Inceptor在稳定性和容错性上表现优于Cloudera Impala,系统运维成本更低。 Transwarp Inceptor在性能表现上和Cloudera Impala基本相当,都有各自擅长的应用场景。 Transwarp Inceptor和Cloudera Impala的可扩展性方面的比较由于硬件资源的限制而没有测试,后期我们会加上相应的测试结果。 结语 虽然标准的Hadoop能够解决用户在数据处理上能与不能的问题,但却不能有效满足用户更深层次的需求,尤其两个方面:一是传统Hadoop使用MapReduce框架作为计算引擎,所有的数据计算以磁盘为中心,因此计算时间长,任务调度延时大,不适合交互式或者迭代式计算场景;二是Hive QL作为Hadoop的查询语言,其支持的语法比传统的SQL要小很多,因此不能满足实际用户的应用要求。 星环科技的Transwarp Inceptor交互式分析引擎构建于Hadoop之上,但使用Spark作为其默认计算引擎。Spark采用基于内存的计算模型和更细粒度的并发调度等技术,有效解决了MapReduce的高延时问题。在Spark基础上,Transwarp Inceptor还扩展了多种执行引擎的优化技术,推出了基于内存与SSD的混合存储结构,有效将SQL任务执行的时间在开源Spark的技术上再降低了数倍,因而能够有效地应用于交互式和迭代式计算场景。 Transwarp Inceptor采用自主研发的SQL编译引擎,完善地支持SQL92、SQL'99等标准,并且部分支持SQL2003以及PL/SQL,因此能够有效满足大部分客户的应用需求,避免大量的应用重写工作。 随着在大数据领域国内外开始处于同一起跑线,我们相信像星环科技这样国内具有代表性的Hadoop发行版厂商将在中国的广阔市场空间中获得长足发展,并且由于中国市场激烈的竞争与磨练,逐步打磨出超越国外先进厂商的技术与实力。 责编:李玉琴 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|