|
DWA助数据仓库走出困境由于BI(商业智能)已成为很多企业的重要投资领域,数据仓库市场也因此越来越红火。Datamonitor研究公司声称,32%的公司计划投资BI用于财务分析,同时还会在接下来的两年里计划进一步投资BI用于其他业务。
另据有关预测,四年后全球信息库的数量每过11个小时就会增加一倍,数据爆炸的影响波及制造业、金融服务业等各行各业。眼下的问题并不在于存储数据方面,人们已在过去的十年里往数据仓库投入了大量资金,用于容纳不断增长的数据池。但重要的问题是如何及时且方便地获取信息。 例如,用户如果频繁对各种数据进行搜索和查找,势必因数据流量过大对网络和应用的性能造成不利影响。在此背景下,DWA(Data Warehouse Appliance数据仓库设备)携高性能、实时访问、节约成本等优势进入我们的视野,或许能帮数据仓库走出困境。 数据仓库困于实时分析 从业务角度来看,数据库的作用已经转变——它要将适应性和可变性融入到IT中。Gartner表示,业务逻辑未必应该存储在数据库中,而是应该靠近它要使用的业务层面;同时中央信息存储库(如数据仓库)也存在不能适应业务需求的问题,如难以很好地服务于实时应用。 BI咨询公司SeeWhy的首席执行官Charles Nicholls说,问题的一方面出在数据仓库的重心和应用上。他说:“难题在于,数据仓库以数据为中心,用于分析及报告的存储数据与手边的流程很难协调一致。” “另外,因为数据仓库往往不保存流程状态数据,更不用说实时流程状态信息了,所以它通常没有进行实时决策所需的那些信息。” 在许多企业,数据仓库被认为是保存历史数据的惟一中央存储库。不过,日常运营决策所需的信息需要通过以业务流程为中心的方式来保存,甚至有可能作为应用的一部分。 许多公司的目的就是找到一种新的数据仓库基础设施方案,该方案既要具体,又要灵活,适合于处理大量数据、并与现有的BI应用和基础设施兼容。它还要便于部署、易于管理、具有合理的成本。 DWA应运而生 DWA是专门为BI的工作流负载而设计的,使用商品化组件构建而成。DWA在体系架构上充分利用了服务器的SMP或MPP的并行特点,这样数据流的处理会更加高效,速度更快。 研究机构Butler Group的分析师Sarah Burnett认为,DWA的出现有望解决数据仓库的速度和可访问性等问题。她说:“这种设备是一种专用解决方案,把软件、服务器和存储设备预先配置在一起,譬如Netezza和DATAllegro提供的产品。这种设备的不同组件经过优化,充分融合了各自的优势,使得这种专用解决方案的速度可以非常快。” DWA旨在消除数据流面临的所有瓶颈,这样的话,就只有磁盘访问成了剩下来的惟一速度限制。而标准接口也能确保这种设备与BI应用、各种工具和信息完全兼容。 该设备使用简单,拥有成本也很低,这是由于它使用了商用的现成组件。DWA以超低价格提供了卓越性能,具有使用方便、可预测性、速度快、价格合理等优点。这种设备具有可扩展性、可靠性和易管理性,设备本身的高度集成化意味着你的工作量大大减少。 高性能是DWA具有的最重要的优点之一。之前需要好几天生成的报表现在只要几分钟就能编制完成。呼叫详细记录、单次网页点击、详细开列的销售点交易以及极其详细的客户活动,这些数据现在都能够近乎实时地随时加以分析。 速度,DWA的追求 度假村连锁集团Center Parcs利用快速分析工具来评估和修正自己的网站,从而提高网站的易用性,增加客户预订量。Center Parcs的IT服务部门主管Richard Verhoeff说,Netezza设备让他的公司可以对所有网页点击流量信息进行聚类分析(cluster analysis),从而得出了有价值的结果。 Verhoeff说:“人们通常认为主页点击量会很大,但我们通过聚类分析发现,其他网页的点击量几乎一样大,于是我们在这些网页上也投放了促销广告内容。” “比如在商店里,吸引人的商品会放在眼睛平视的位置,同时,店家能够直接观察顾客的行为。在互联网上(不同于商店),你必须得分析数据,才能知道眼睛“平视的位置”在哪里;因此,你需要这种DWA设备的强大功能来分析数量巨大的记录信息。” 要是没有DWA,用户所能进行的查询很有限,查询起来也很费时间。现在由于复杂查询的时间缩短到了几分钟、乃至几秒钟,用户就可以任意发挥想象力,重复更多次的分析,或者对粒度非常细的数据执行一系列全新的分析。 比如在电信行业,呼叫记录的迅速增长带来了数量众多的数据,这往往使得许多公司很难迅速、有效地分析客户和呼叫方案信息。 释义DWA的误区 但是一些数据仓库领先厂商对DWA有不同的看法,他们认为DWA由于采用了专有技术,其上的软件无法移植到其他硬件平台上;而且设备升级起来难度大、费用高;另外,DWA只擅长于处理某一项或某一类工作,不具有数据仓库的通用性。 对此,独立IT调研公司Bloor Research的研究主任Philip Howard表示,这些看法有误区。他说:“事实上,对这种设备所要关注的方面其实与其他任何一项技术没什么两样。它是不是可以完成我想要它完成的工作?它会支持我所需要的可扩展性和性能吗?它是不是以一种经济可行的方式完成必要的工作?” 如果你有数据仓库,那么它绝对不会变小。所以,如果你面临下面这样的压力:提供更多分析信息、处理实时数据、预算面临制约但是又立即需要某项技术,那么DWA也许能满足你的要求。 DWA也需要客户化 记者针对DWA在国外应用的现状,也采访了国内商业智能专家鲁百年。他表示,DWA的方法从根本上来说与传统数据仓库的实施没什么差别。传统上建立数据仓库的方法的确存在问题,“追求大而全,因此出现了很多失败的例子。”他认为,现在建数据仓库应该遵循三个原则——业务驱动为主,按照业务部门的应用需求逐个建立数据集市;想大做小,即从小处着手,但在最初设计时考虑好扩充性,将来每个数据集市可以相互共享统一的公共信息源;分段设计,将数据仓库、核心业务系统和具体的应用系统在设计上隔离,但相互之间又能有机地联系。 鲁百年介绍说,BO公司也有类似于DWA的产品,但他相信任何商业智能产品都需要客户化,这只是程度上的差异;同时无论对大企业,还是小企业,建设数据仓库的必要流程不可或缺,即使是DWA这样打包好的方案也需要客户化。 责编: 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|