|
我心目中的数据仓库应用Happy 20060903 又经历了一个数据仓库项目,又有时间来思考这个问了多少遍的问题。 首先是信息。从数据到信息再到知识,这个过程是现在公认的,是我们做各种分析型应用的目标。知识有点太复杂了,先看看信息。什么叫信息?有这么一种解释:通过对数据进行分析找出其中关系,赋予数据以某种意义和关联,这就形成所谓的信息。那么可以看出组成信息的几个要素:规律、关联、意义。 我们可以通过这三个要素来判断我们数据仓库项目的成败(不同的人对项目成败的看法不同,就不深入讨论了)。我们能提供给客户哪种信息呢? 我想无论是在做需求还是架构设计阶段,都应该带着这个问题来思考。我们总是碰到这种现象:到了项目快要结束的时候,发现需求无法控制,发现需求定义不合理,发现技术架构有问题。我没有太多的项目管理经验,可以有很多种途径来解决和控制这些问题,但是我想:如果从项目开始阶段,让客户、项目组成员都明确我们的项目是为了寻找对客户有用的信息,是为了寻找业务中各种现象的规律、关联、意义,从这一点去控制需求,确定需求范围,设计系统流程,就可以使我们最终项目的结果在一个可控的范围内。 一句话:目标明确! 根据这个思路我们来设计一个流程,这个流程表示我们将如何使用我们的数据仓库系统: 1. 明确客户想要干什么? 2. 明确我们系统能够提供什么信息? 3. 根据这些信息,客户能够完成什么任务? 4. 如果用户是带着问题来的,系统应该提供一个导航功能,通过导航来一步步引导客户自己来发现他们所需要的信息。 导航功能应该是这样的: 1) 用户选择要解决的问题(那么在系统中,应该有个问题分类库) 2) 每一个问题对应一种或者多种解决途径,解决途径包括选择哪些分析方法、包括哪些数据、数据的粒度控制在哪种程度; 3) 根据用户选择的结果生成针对这个问题的数据集市(或者是cube、语义层等) 4) 用户可以选择数据展现的方式(当然可以有缺省方式) 5) 生成结果 6) 用户自己根据结果来判断是否能够解决这个问题 7) 如果还需要继续分析,循环2-6
既然是高智商的过程,那么就应该充分借助于人脑,提供更多、更有效的人机交互能力(数据挖掘就可以看作是高于OLAP分析的信息系统)。我们提供给客户数据仓库解决方案是为了帮助客户发现、分析、解决问题的,如果现在的实现达不到我们心中的目标,我们有两种方法来解决:一是借助更高的技术,比如数据挖掘;二是改变我们现有的实现方式。 周剑 20060904 我觉得你的意思,应该是说,在用户使用数据仓库系统的时候,依靠的,应该是一个分析流的概念。而我们坐的,应该是收集、整理或者是拿出我们自己在这方面的东西。 每个用户,每个人,都会有自己的发现问题、分析问题、解决问题的手段的习惯的经验,并能根据自己的这套经验和习惯的效率,来不断调整。 这其实,也与其管理水平,管理经验有关。有经验的人,看到报表,能凭直觉发现问题,能根据自己的思维、自己的经验来分析问题、解决问题,通过这种手段,可以提高管理水平、改善企业管理。如果经验达不到的人,面对着我们提供的一大堆的经过整合的面向主题的报表,除了发呆、不用,还能做什么呢。更有甚者,有的领导最希望系统能提供一份文字性的分析报告。 从我们说过来,系统尽可能整合进这些分析经验,比如,告警功能,便是将其判断的经验直接变成我们通过分析判断后的预警提示;又或者,嵌入适宜的行业经验作为预置的分析流。毕竟,对于上面提到的那种没有没有意识和经验的客户,引导他来作需求,耗费的时间和人力,会增加不少,需求调研,也会拖长。 Qing 20060904 西宁总结的这个流程和导航功能,应该就是如周剑所言,是体现一种"分析流",或者说体现一种分析思路吧。 也许这个理想的"思路"并不存在,但至少,如果能找到一种放之三海,或两海皆准的,也就凑合了。 责编:姜玲 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|