预测分析应用调查

  作者:刘庆
2007/5/28 15:38:05
本文关键字: ttnn 2007年02期

TDWI出来一份分析报告,讲述2006年预测分析市场的故事。通过750份调查问卷得到这份报告。参见:
http://groups.google.com/group/ttnn/web/PA_Report_Q107_F.pdf

何谓"预测分析"?总觉得预测分析是个不太恰当的名字,听起来似乎是指用"预测"的分析方法,其实,这里只是指通过数据分析帮助客户进行下一步决策行动而已。作出一些统计报表,从中看出一些规律,这算不算预测分析?用excel里面的回归函数计算出下个季度的销售额,算不算?这份研究将BI分析应用分成4个层次,报表、OLAP/数据可视化、监控到预测。按照个理解,所谓的"预测分析"是指使用了特定技术的一种应用,还不如"数据挖掘"更通俗一点呢。我们现在做的,帮助客户做数据分析,支持营销活动,就是预测分析。ttnn里面也有很多在谈这个话题。

难保不同的被调查者对此理解有不同。问他们是否上了"预测分析"系统,有近一半的人表示纸币观望,其他还有无计划、正在干、部分实施、完全实施了的。猜想一下,这无计划的恐怕是因为他们尚在数据整合阶段,或者是竞争压力不大,或者是自己已经有这种预测分析应用而不知道吧。那些号称完全实施了的,恐怕是吹牛不上税的,喜欢"完全"这个字眼而已。

构建这种预测型分析应用,该是个什么样的过程呢?其实大抵还是跟数据挖掘方法论提到的类似。业务定义、数据探索、数据准备、建模、模型部署,老掉牙的东西。关键还是在实施时候的细节上面啊。比如说抽样,即便方法里面强调抽样,可为了省事不抽样,模型照样也能建的起来啊。看来,在TDWI的原始调查表里面,并没有将抽样作为一个环节让被调查者考虑。其实让我来说,这个环境倒真的如SEMMA方法论里面单独拎出来,以表重视才行。倒不是为了模型的精度,而是为了让建模的整个过程缩短,迭代多几次。

方法论这个东西,是概括的,它不是规定你必须得这么做。其实每个人做事都有一套方法,也许道理跟那些有名字的方法论是相通的。有些人很蔑视这种东西,有些人则拼着命往它们身上套。但追求本质,它还是为了提高人们干活的效率嘛。方法论告诉你只有在开始将目标定义地越明确,后面的工作才不会白作。这个道理大家都明白的很呐,可如何将目标定义清楚可是个大问题。却也不能因为说不清楚就不进行后面的工作了?即便后面的数据探索、建模其实是白费功夫,但至少有进展啊,至少做了一轮以后,会对那个目标定义地更清楚一点啊。

所以说,方法论表达的是一种成熟的干活模型,但在大家不成熟的时候,也每必要装,就循序渐进地干吧。在不成熟阶段,多谈那种高高在上的方法论,不如谈谈具体的细节。

比如报告中有个环节比较有意思,是选择变量的数目。从很早以前,我就非常郁闷为什么大家建模要考虑几百上千个变量,甚至以为是越多越好。最近半年才有些感触,别用太多的变量。从报告反映的结果来看,模型初始版本在40个变量以下,最终版本在20个以下的占了一半。虽然这不能说明我的观点是对的,但也算安慰以下——自己不是少数派,至少跟实际情况相符。不过世事难预料,谁知道真理是不是掌握在少数人手里呢?唉,就是这般怀疑主义。

谈了预测分析的定义,还有建模的过程,当然还有未来的预测。不过这部分是无趣的,只要注意到这份报告的赞助人,是SAS、SPSS之辈,难保在最后的趋势里面加上工具的一些看似客观,其实具备引诱性的趋势建议。当然,即便可以鄙视,也只能屈服于这些趋势,胳膊拧不过大腿。

要注意这份报告反映的主要是欧美的情况,被调查者中,欧美占了80%,亚洲只有7%。

总体看来,欧美的预测分析应用也没见多牛逼,也是起步不久嘛。不过从行业分布,从效益评估方面却能看出国内这方面应用的差距。比如在这些调查者中,除了咨询服务行业占的最多(因为他们更关注这种事情),其他诸如政府、电信、制造业、医疗卫生、零售、保险几乎都是差不多份额,发展比较均衡。这种应用的成功与否,我看还真的不在于采用何种高深的分析方法,而是看你分析结论能不能形成知识、规则,去指导行动。

经常听到国外的一些BI案例,如何在管理、经营、客户服务中嵌入分析功能,多牛逼啊。如果想想实现的方法,到也不是难事啊。如果决策要精细化,需要精细的分析结论来支撑,有需才有应。而如果是一个极具扩张的环境,是无需也有应。前者强调投入回报,后者不惜成本。所以,这个差距还不光是在建模水平上,还跟大环境有关系的。

相信在国内很多企业都有这样的预测分析需求,每个月出一次报表是满足不了他们的胃口了。只是听起来搞这种预测分析成本有点高。硬件、软件是个问题,数据是个问题,人员也是个问题。

但其实可以针对这种需求作个小项目,不需要数据仓库,不需要昂贵的硬件、软件,只需要购买数据分析服务就可以了。帮助清晰勾勒出业务问题,使用最便宜最通用的分析工具,基于数据回答那个问题。

责编:刘庆
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918