|
用友UAP曾小青:改进的多指标RFM客户细分用友集团UAP中心大数据专家曾小青表示,在企业,海量数据分析一直是技术瓶颈,基于数据挖掘技术对客户进行细分,既是传统客户细分方法的补充, 也是商业分析技术的重要应用。 指标对比 为避免这些缺陷,曾小青将传统RFM进行改进,产生了多指标RFM模型。在深入分析传统RFM指标的基础上,构建包含3种类型10个指标的RFM细分模型,用以较为全面的反映客户价值。 曾小青介绍,用多指标代替传统的消费近度、频度和值度,主要基于以下考虑:第一,用多个购买时间代替单一的最近购买,可真实反映客户在时间上的购买规律和整体的购买时间跨度,更易于区分新老客户;第二,用多个频率数据代替整体的消费频度,能更好的体现出购买的集中性,知道客户最最频繁购买月份、最弱购买月份和相关金额,从而为市场营销提供依据;第三,通过平均金额可分析出用户的平均消费额度。结合总体消费金额,可以容易判断出大份额顾客。 其次,利用因子分析法提取细分变量。传统RFM模型三个指标在权重划分问题上存在着各种不同的意见。Hughes认为RFM在衡量一个问题上的权重是一致的,因而并没有给予不同的划分。而Stone通过对信用卡实证分析,认为各个指标的权重并不相同,应该给予频度最高,近度次之,值度最低的权重。国内普遍采用的权重分析方法为层次分析法,但是层次分析方法相比权重的确定更倾向于方案决策的制定,而且在构造初始特征矩阵时,由于人为因素的影响较大,最终导致了权重结果的不准确。在考虑多指标RFM模型指标权重时,曾小青选用因子分析法,找出潜在影响客户细分的因素,确定因子个数和客户在因子上的得分,根据各因子解释客户细分的程度确定各因子的权重。 因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。假想变量(即因子)能够反映原来众多变量的主要信息。根据因子分析的一般步骤,可将改进RFM模型在各因子上的得分定义为: 其中, X为改进RFM模型指标,FACTOR为因子,矩阵为因子得分系数矩阵。 第三,基于划分的客户细分聚类算法。“在选择聚类的算法时,由于改进的RFM指标都是数值型数据,不是分类属性数据,并希望客户类型互不重叠,因此我们使用基于划分的聚类算法(Partitioning Methods)进行客户细分。”曾小青解释道。它以各个指标在因子上的得分作为判断依据,将相似性较强的客户细分在一个类别中,相似性较弱的客户存在与不同类别中,确保了同一类别中的距离最小。最常用的基于划分的启发式聚类算法是k-means算法和k-中心点算法。k-means算法简单快速,但容易受噪声点和孤立点影响,且不适用于发现非凸面形状的聚类。k-中心点不是用质心来代表聚类,而是用最靠近中心的一个数据对象来代表聚类,消除了对孤立点的敏感性,具有较强的鲁棒行,但执行代价更高。典型的k-中心点算法有PAM算法、CLARA算法等。为了处理大数据集,可采用CLARA方法进行聚类,通过改进启发式函数,或结合其它方法,比如粗糙集法、遗传算法、Tabu算法等可进一步提升聚类效果。 经过改进的多指标RFM客户细分法,,避免了人为因素带来的数据偏差,提高了对客户细分的科学性和准确性。为数据挖掘的应用,以及消费行为的研究都提供了更好的依据。 责编:王雅京 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
|
|