浅析联邦式数据仓库架构

  作者:姜玲
2007/4/11 17:17:08
本文关键字: ttnn 2006年07期

Jerome 20060718

曾在网上看到过联邦式数据仓库架构的介绍,简单谈谈自己的理解,希望能和大家一起探讨。

联邦式数据仓库架构是一种异构的商业智能系统的整合方案。它的思路是如果企业中可能建立了几套相对独立的商业智能解决方案,即可能是独立的数据集市,这时,通过一些参照数据(Reference Data),我们也可以把这些相对独立的可能是异构的系统进行集成,组成联邦式的结构。

联邦式数据仓库架构一般有两种类型,一种是区域性的联邦,另一种是功能性的联邦。

区域性的联邦指一个大企业有很多地区,在每个地区建立地区的数据仓库满足地区性的分析需求,在总部建立全局的数据仓库满足企业分析需求。地区和全局的主要区别是,地区性的数据仓库保留原子层的数据,全局性的数据仓库主要保存汇总后的数据。而另外建立参照数据来保证所有数据仓库之间的数据一致性问题。各地区与全局的数据相对松散的联系在一起。

功能性的联邦指企业可能已经针对一些主题建立了数据仓库。这些针对不同主题的数据仓库及商业智能解决方案也可以通过建立参照数据来进行集成。

而参照数据应该是联邦式数据仓库架构的最为核心及难于处理的部分,它的处理方案是决定一个联邦式数据仓库架构是否成功的关键。

个人觉得,对于一个还没有建立数据仓库和商业智能系统的企业来说,采用区域性的联邦也是一种可以考虑的解决方案,而参照数据可以考虑像总线架构的一致性维度类似的处理方式。其实这样的方案和总线架构的差别不大。对于企业内已经有了主题的商业智能的解决方案时,是否采用功能性的联邦是需要充分考虑企业的实际情况的。很多时候,推翻掉一些数据集市比把它们集成进一套总体架构可能还容易一些。


刘庆 20060719

说起这个"联邦"数据仓库,我就想到EII,印象中,这两个概念走得比较紧。
 
在我们身边,不知道有没有这种联邦式的。按照jerome说得,区域性和功能性两种类型。譬如电信行业吧,在省公司一级建立数据仓库,然后上报一些汇总数据到集团总部。这看上去有点像联邦哦。
 
但这里的联邦数据仓库指的是单单集团总部那个库还是全国各个级别所有的库呢?理解起来应该是后者,但显然,在全国范围内,并没有形成这样一个统一的"库",各个省的系统相对自治性太高了。因此,我看在电信行业这种情况,还谈不上联邦数据仓库。
 
至于功能性的联邦,挺让我疑惑的。因为初看之下,这不就是kimball口中的数据仓库嘛——若干个数据集市放在一起就是数据仓库。
 
以前有人将这种数据仓库当作未来的趋势,也许确实如此。中央期望统一,地方期望自治,到头来,联邦可能就是一种折中的方案。

Jerome 20060719

--但这里的联邦数据仓库指的是单单集团总部那个库还是全国各个级别所有的库呢?理解起来应该是后者,这个,我觉得既然称为数据仓库,应该是所有的库加在一起称为联邦。

--电信行业吧,在省公司一级建立数据仓库,然后上报一些汇总数据到集¬团总部。这看上去有点像联邦哦。

对于这个是不是联邦,我觉得可能是判断数据是否只从各地区汇总到集团总部。从他们架构的资料来看,联邦架构中数据流应该是双向的,能进行数据交换的基础就是参照数据。如果只是单向的汇总,我估计还不算联邦。

--功能性的联邦,挺让我疑惑的。因为初看之下,这不就是kimball口中的数据仓库嘛——若干个数据集市放在一起就是数据仓库。

这个我也比较迷惑,因为它和总线架构太像了。我觉得区别可能是功能性联邦不像总线架构那么强制性的将一致性维度复制到所有的数据集市。有可能通过对照表来实现,虽然各个数据集市数据交互起来要麻烦,但是对于已经建立好的独立数据集市不需要大的修改。
联邦架构没有实际接触过,谈到东西也都是猜测。感觉既然称之为联邦,估计数据之间的关系要相对松散一些,但即称为一种数据仓库架构,数据之间的交互功能是应该提供的。

Innovate 20060720

所谓的联邦数据仓库解决方案IBM在90年代就开始做了,但是他们提出的解决方案结合了Inmon和Kimball两者的优点,更彻底,功能更强大。而IBM自己的数据仓库项目更是将全球区域性、部门级(含总部)、不同前端应用需求多个因素全考虑进去了,成为业界经典数据仓库项目。

Jerome 20060724

我一直觉得结合了Inmon和Kimball的优点的数据仓库和联邦架构不太一样,虽然我没见过实际的联邦架构是什么样的,但是凭感觉它应该是松散耦合的,否则和其他几种架构就没什么区别,也就不可能出现一种新的架构方式。我还觉得联邦架构可能是为了解决已有系统的集成问题而提出的一种架构方式,即对已有的独立数据集市进行一些处理,如加对照表等,使它们能交互数据。

像Innovate511所提的IBM的数据仓库中将全球、部门等都考虑进去,应该是逻辑上是集中的,而物理上是分布式的数据仓库架构,其中数据之间的关系应该是很紧密的。

一点猜测,欢迎大家指点。

责编:姜玲
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918