[原创]从搜索引擎看商业智能BI

  作者:罗永辉
2009/11/19 11:43:16
畅享网:商业智能已经在实现着三个转变:从数据驱动转向业务驱动、从关注技术转向关注应用、从关注工具转向关注工具产生的绩效。

    3、商业智能在三方面需要借鉴搜索引擎

    1)搜索引擎获取结果的方式极为简单,值得借鉴

    商业智能应用主体的泛化,使得BI融入日常业务运作,这需要极为简单的操作方式和低成本传播方式。而搜索引擎的简易操作性可以实现这个目的。从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。操使用非常简单。操作型BI日益壮大,BI将在单位的基层、中层中得到应用,也就是流程型BI(或操作型BI)将得到重视和推广。这种流程型BI的“下里巴人形象”将实现“一般员工也需要用BI,也能用BI,也必须用BI”,从而使BI最大化地用起来 。可见此时的用户已经包括非技术/分析专业的业务/管理人员。商业智能产品提供的查询、定制、分析模式对非技术/分析专业的人员来说仍然 显得过于复杂,无法支持他们快速、低成本的获取想要的结果。当前商业智能在语义层方面已经有了较大提升,语义层功能已经比较方便了业务用户对数据的操纵。但在理解自然语言方面,例如让系统能正确理解人类的自然语言输入的信息,并能正确答复(或响应)输入的信息,搜索引擎相对做得更好。

    2)完善和提升实时理解分析能力

    商业智能在if-what-how模式基础上,补充what-how模式,实现实时智能。不少商业智能解决方案,特别是应筹学的建模应用,一般都是先假设问题,并对此建模、构造数据及应用体系,针对特定领域,采用特定的分析方法,返回特定的结果。而采用搜索引擎技术则可以通过“数据+语义+分析方法+结果编排+呈现”的方式,具有数据范围广、分析结果动态的特点,能实现实时智能。当前部分商业智能产品中可以方便的加入各种类型的数据源,并在类似Google的搜索框中输入关键字(比如:“12月份 销售收入 销售费用”),系统将返回合理组织的图文并茂的结果。数据—趋势图形”的交互式联动也引起了许多用户的兴趣。

    3)增强对非结构化数据的处理能力

    非结构化数据对于业务处理日益重要。支持一个决策的信息不仅仅限于来自数据仓库、ODS层的结构化信息,往往还包含大量的非结构化信息,比如文档、邮件、媒体文件等。搜索引擎在处理图片、视频、音乐等非结构信息方面有着较强的能力。

    4、搜索引擎在四方面需要借鉴商业智能

    1)借鉴专家系统,提高搜索引擎对用户检索提问的理解,去掉多余的检索结果。

    当前搜索引擎检索结果已经有较大准确性,但仍需完善。过多的信息、过多的无关紧要的信息,应该在检索结果中去掉。附加的多余信息的出现,重要原因是搜索引擎不理解用户提问的原意。优化检索结果的解决办法当前已经很多,如元搜索引擎、集成搜索引擎、垂直搜索引擎都是较成功的例子,能实现非www信息的搜索 提供FTP等类信息的检索、多媒体搜索等,当前的解决方案倾向于确定搜索引擎信息搜集范围,提高搜索引擎的针对性 。

    此处提出针对特定的、复杂的搜索,可以借鉴专家系统对问形式的思路,以提高搜索引擎对用户检索提问的理解。

    2)提升智能程度,从搜索数据/信息到给出解决方案,甚至可以执行方案

    现在的搜索引擎,它就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径,提供了相应的数据或信息。至于信息如何分析和判断,并帮助我们用以决策甚至直接执行,还只能依靠我们的大脑。当前搜索引擎根本无法做到。但是,对于用户,搜索不是目的,他需要给出结论,甚至需要帮助他实施。比如,我想买MP3,衡量指标是品牌、价格、质量、送货时间,我需要在搜索引擎中放入这四项,让计算机执行,一定时间后搜索引擎已经给出了四个方案供我取舍,或者替我做了决定性,帮我买到了某个MP3。这是用户需要的,而不是放出一堆信息,让用户一项一项的判断分析,花费太多的精力,这不是我们所需的。

    所以当前搜索引擎的智能程度不高,仅解决了商业智能智能程度的第一个等级:查询/报表。 商业智能在应用智能程度上分为三个等级,第一层次是提供数据参考帮助用户作数字方面的回忆或确认已发生的事实,这叫查询/报表; 第二层次是帮助用户寻找关系、寻找原因并加以预测,叫“综合分析”;三是产生几条实现目标的路径,让用户取舍,叫做 “方案选择”。方案选择层次事实上需要产生应对问题的措施或解决办法。

    商业智能在综合分析和方案选择上有些进展,但依然不成熟,搜索引擎和商业智能可以融合共进。

    3)革新网页重要度的评价体制

    如何展示用户所需的数据或者结论,以什么标准进行衡量,这对于搜索引擎和商业智能都是非常重要的课题。

    现在搜索引擎有两种评价标准,即基于链接评价的搜索引擎和基于访问大众性的搜索引擎。“链接评价体系”认为,一个网页的重要性取决于它被其它网页链接的数量,特别是一些已经被认定是“重要”的网页的链接数量。这种评价体制与《科技引文索引》的思路非常相似,但是由于互联网是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性(百度百科)。基于访问大众性的搜索引擎也具有类似缺陷。当前的办法是弥补,而不是革新,还没有找到替代上述评价体制的更优方案。

    更为重要的是,由于任何人都可以在网上发布信息,搜索引擎能够帮您找到信息,但无法验证信息的可靠性,从而导致了搜索引擎数据采信度方面的先天不足。

    如何判定所抓取网页的重要度,如何判定网页信息的可信度,搜索引擎还有很多路要走。

    4)借鉴商业智能的应用方法,研究搜索用户的行为和需求

    搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的一个有效工具”。搜索引擎聚集庞大的用户需求信息,用户每输入一次查询,即代表了一种需求。累积并分析“需求数据”具有重要的商业价值。商业智能相关产品可以帮助搜索引擎厂家充分利用“需求数据”,找到更有利的商业模式。

    事实上,业界早已开始了商业智能和搜索引擎的这种融合。

    2004年开始, 商业智能与搜索引擎的结合开始受到广泛的关注。2006年起,各个商业智能厂商普遍出现该类解决方案。如Business Objects Google Solutions 2006年支持多种数据结构的搜索,包括桌面电脑中文本文档、电子邮件、办公文档,BI平台中水晶报表、仪表盘数据,以及企业合同文档等信息。WebFocus Magnify 2007年搜索索引结构化数据,并在搜索结果中提供BI报告的搜索导航工具,通过树型结构展现搜索结果。SAS SAS BI Google OneBox企业版解决方案 2006年与Google OneBox紧密集成,支持用户沿用原有搜索方式获得更深度的搜索结果。SAS同时提供文本挖掘技术,帮助用户在企业文档中发现和提取知识,建立数据关联。近期的SAP BusinessObjects Explorer则以类似搜索引擎效果在提高商业智能系统的易用性、降低查询及搜索响应时间、结果编排及组织方面都取得了较大的突破。

    相信,随着实践的深入,商业智能和搜索引擎相互融合更入佳界。

共2页: [1]2 下一页
责编:姜玲
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

罗永辉呼吸BI

rss订阅
管理学硕士,四年的BI工作实践,对BI(数据中心)项目关于前端分析、预测和决策算法与应用功能有较丰富的实际操作经验,对数据挖掘有一定程度的认识;较为熟悉CRM和业务流程改进(BPI);致力于行业的理论研究和实践,曾在咨询和培训方面服务过以下主要客户:中国颐高集团、杭州移动、浙江省烟草、杭州烟草、绍兴烟草、昆明烟草、浙江丽水烟草、浙江嘉兴烟草、北京烟草、江西省烟草、四川省烟草、云南曲靖烟草、河南焦作烟草。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918