|
思考客户属性第一篇 分类方法 最近在考虑客户视图的事情。客户视图要解决的是什么问题呢?重要的一个环节就是对客户属性的管理。所谓管理,应该就是让每个客户属性都能唯一归入某个类别,不管-是已有还是未来的。这里说客户属性是广义的属性,可以是客户的年龄性别,也可以是一个分析模型给客户标志的“离网概率”。 准备从三个方面,来说说客户属性的分类。分类方法、成长性和物理化。 管理客户属性,其实首先是对客户属性的分类。说到分类,虽然我们平常无时无刻不在进行,但并没有什么简易方法,复杂的有,比如书本上所说的种种分类理论。那些理-论也许有用,不过看不懂的情况下还是先来思考一番。其实这是一个经常思考的问题了。为什么文件系统如此设计,yahoo的邮箱跟gmail邮箱管理邮件的不同方-式。 分类体现人们对事物的概念划分,比如一个名字叫做“日记本.txt”的文本文件,应当放到那个目录下面。习惯良好的电脑使用者,可能会将这份文档放到一个叫做专-用目录,便于查找。但如果这个文件放在一个很深很深的位置里面,他可能为了方便起见,在桌面建立一个文件链接。 对客户属性进行管理也要进行分类。可以模仿文件系统那样的方式构建一颗“客户属性分类树”。它从一个根节点开始,不断生长、细化,根节点细化若干子节点,子节点-再分别细化若干孙节点,子子孙孙无穷匮也。每个节点,我们可以称之为“类别”吧,最后到了无法再细化的时候(这里的无法细化可能只是暂时的),此时的节点在树里-面叫做“叶节点”,它表示的就是我们待分类的事物,比如此处的客户属性,或是图书、文件之类的。比如,将长途通话分为长途结构、长途习惯,然后,长途结构再分成-国内长途、国际长途,他们下面就没有再细化下去了。那么长途结构就是“类别”,而国内长途叫什么,叫做“属性”?不行,犹豫了很久,发现虽然“国内长途”目前是-没有细化,但不代表以后就不会细化,比如那天又按长途区域划分,比如打到东北,到华南的长途。现在这个属性没有细化是因为没有那样的需求,但如果那天有个那样的-需求就麻烦。那么“国内长途”就得从“属性”改成“类别”了。 可以看到,这种分类跟对文件、图书的分类还有所不同。我们这里谈的分类,还是一种对人认识事物的概念的划分,而如果概念本身就不是非常清楚的东西,就会随着时间-不断细化。图书、文件是人们有清晰概念的东西,而“客户属性”却是人们概念不清晰的,要逐渐清晰化。 不管如何,这是一种先组式分类方法,类别先确定好了,再将事物归入某个类别,一个类别只能唯一归属一个父类别。这是容易让人理解的,但事实上却有不能满足人们对-事物的认识。比如上面“日记本”的例子,一方面将它放到一个专用目录,将它归入到“私人文件”类别,一方面,有要将它归入到“常用文件”类别。这个时候,建立链-接到是一种方法。链接是“虚”的,是指向实际位置的空壳。 客户属性分类中同样也存在类似的问题。比如“长途通话”类中,有一类“漫游时长途”类别,那么这个类别是放在“长途通话”类里面呢?还是放在“漫游通话”类里面-呢?这个时候,倒是可以建立一个链接,实际的归属是归于“长途通话”,而再“漫游通话”类中引用这个类别。 先组式分类的好处当然就是比较严谨。因为一个类别只能归属一个父类别,可显然,也不够灵活,也并不太符合我们对事物的多角度认识习惯。 因此,除了先组式分类,我们可以结合后组式分类方法。用标签的形式给事物打上印记,这相当于是从多个维度去观察事物。再比如“漫游时长途”类别,可以给它标记一-个“长途”标签,同时也可以标记上一个“漫游”标签。这就跟论文里的关键字一样了。因此,当我们需要得到所有有关长途的客户属性时,就可以通过查询“长途”标签-来得到。而这点,在先组式的分类里面不太容易办到。关于长途的属性,可能分散在不同的类别里面。 可惜,后组式分类的麻烦在于不成体系。比如选出所有“长途”的属性,会发现,他们之间没有层次关系,一个“漫游时长途”类别,跟一个“长途资费”类别之间似乎看-不到什么关系。所以,不妨将先组式和后组式结合起来。但有个担心,就是这会过于复杂,因为看看现在存在的一些分类管理方法中。大家都是选用某一种分类,而不是两-者结合。比如为什么windows不选用后组式方式来管理文件?gmail为什么不用先组式方式来管理mail?我想,如果真的结合起来,恐怕他们就不是如此好-用甚至是优美的系统了。 但暂时将这个担心放一放,自我安慰一下。发现我们现在谈论的“客户属性分类”跟文件、mail分类不大相同。后者毕竟还强调了易用性,因为操作系统、email-是面向劳苦大众的,易用是一个重要的特征。但在管理客户方面,易用性到并不一定首当其冲,管理的完备、方便性可能更加重要吧,即便混合两种分类方式导致理解复杂-,但通过培训也许能解决。因此在这个安慰下,我们先决定将两者混合起来。 混合起来的结果。一方面构成了一颗分类树,一方面,树的每个节点都可以加上标签,这个标签可以影响到这个节点的所有子节点。 第二篇 成长性 昨天谈了对客户属性分类的两种方法结合,先组式和后组式结合。作后是出来一颗树,这次再来说说这颗分类树的成长性。并且李陶红也针对分类方法提出自己的观点: 正好,准备用”成长性”这个话题来回复一下。 要知道人的概念是逐渐清晰的过程,并不是一下子就能够事物认清楚,明白地划出类别出来。看看图书分类法,可以分成艺术、数学、社会学等等科目,会计也可以,因为-人们对这些领域的知识已经认识到一定程度,已经成熟了,所以可以建立一种标准。但在大多数领域里面,人们对事物的分类是争论不休,谁也不愿意认同别人的分法。 如果我们将这种认识阶段看作是不成熟期的话,就可以对分类树有个“成长性”的说法。在这个阶段,分类树还是一个小bb,还没有形成一颗参天大树。就像前面的例子-里面,“国内长途”类别暂时不会再细化,但不能保证未来不会细化。随着业务发展,需要对客户的各个方面去了解它,因此会涌现各种不同的客户属性。而了解客户不是-漫无目的地了解,大家要知道客户属性可以衍生出无穷无尽出来,只有再进行某一方面地专题分析时,才会细化到某个客户属性。比如原来有个“国内长途”属性就够了,-支持普通长途套餐资费地设计OK。但如果有一天出来一种政策,想制定一种对国内不同地区的长途采取不同优惠资费,那就得将这个属性细化下去。 在对事物认识的不成熟阶段,构建分类树时就得照顾到它的未来的成长。通常可以看到有一些做规划的工作,立即抛出一个非常庞大的,面面俱到的体系。不能立即去判断-这种体系是否完善,而是要看他要解决的问题域是否成熟了,如果是一个新兴的领域,这个貌似成熟的体系肯定是瞎掰的。人们认识事物的方式是有个过程的,这甚至是自-然规律。如果你立定一个理想的目标,那就忽略了最本质的发展规律。就像人的成长一样,你为他立下一个雷锋的榜样,不论这个小孩是什么环境,以及他的个性是什么。 构建客户属性的分类树也是一样,一方面要有个模子,一方面要充分发展个性。这里所谓的个性,就是不同个体对客户属性的认识。而前者所谓的“模子”,就是大家共同-遵守的规约。这里可以理解成为对分类方法的一致认同,在此基础上一层层构建分类树。首先可以搭建一个粗放的分类树架子,这是大家容易达成一致意见的。比如将客户-属性首先分成行为类、价值类、生命周期类,行为类可以划分成通话行为类、新业务行为、服务行为类等等。 接下去,如果发现自己已经划分不下去,强制自己去划分其实也没有什么意义。一方面是因为大家各有各的想法,一方面是大家都没有想法。各有各的想法让我们形成不了-统一意见。没有想法,让我们的意见失去深度。 如此,对于剩下的分类,交给日后做具体专题分析来细化下去吧,从实践中得到。比如上面为了新的长途资费政策,需要对国内长途进行细化。或者到了要对客户套餐进行-梳理的时候,对客户套餐进行诸多的分类细化。这些都是逐步加上去的,这些活动都在在现有分类树基础上,专门就构造各自的子分类树。最终形成一颗庞大的分类树。当-然,这些子分类树的构造方式还得遵循共有的原则,这个共有原则是大家必须遵守的,呆会儿再说。 这里也有个问题现在还没有想明白。一个是各自独立的分类树构造活动必然造成跟原有分类,以及其他分类树的冲突,从而破坏了“树”的定义,导致重复的属性,归属在-不同类别下面。比如有两个项目,一个为长途资费设计做点分析,要对长途话务进行分类。另一个项目是分析与竞争对手通话,对竞争对手话务进行一些分类。前者可能将-“长途交往”类别细化为“长途交往运营商”。而后者,可能将“竞争对手”细化成“长途通话”,这两者可不就是一样的?但如果这是两队人马在分类,不好协调。倒是-如果长途分析在先,已经形成长途的分类树了,那么竞争对手的分类树中,可以先通过搜索现有分类树(比如通过“竞争对手”标签来查找),一旦发现在长途交往中存在-了需要的类别,用链接的方式链过来即可。 至于两个分类活动同时进行,如何避免冲突,这其实也不是非常大的问题。反正要知道,在不成熟期归整的分类树,经过长期发展下去,会形成一颗庞大甚至凌乱的关系,-到了一定时候,恐怕还是得重新整理,近些年来,不是挺流行“重构”这个说法的吗?重构的时候,已经存在了各种被细化并被归类的属性,重新分类也是一项梳理工作,-好事一桩。 可见,要照顾分类树的成长性,是团队协作的事情。各种细化的子分类树是在不同阶段,由不同的团队完成,就得有一些共同的规约。包括。
这里强调成长性,并没有立下一个标准,说客户属性分类就应当是这样的,分成多少层什么。而是强调了个体性的差异,以及要遵循发展的规律。当然,我相信肯定有很多-朋友后面会问我要我们的客户属性分类到底是什么样的,因为商业秘密的原因,也不能在此贴出来。如果电信行业发展得比较成熟了,那么肯定会有一个稳定的客户属性分-类体系。但目前,恐怕大家都是各走各的。 第三篇 逻辑到物理 前两回说了客户属性分类方法和分类树的成长性,再来说说客户属性分类的逻辑到物理。 逻辑和物理,应该很好理解吧。最终客户属性的表现形式可能是一个字段,这是物理的,比如叫做长途通话次数,或者以数据挖掘里的叫法,叫做变量。而逻辑是从业务层-面,有一个属性是可以衡量长途通话的。我更赞成从逻辑到物理,而不是从物理到逻辑。但以前的很多做法是后者——先列出有多少个字段,从哪些系统而来,再归成几类-。这种归类的方式好处是一下子就能构建一颗丰富的分类树。而另一方面,这些物理属性到底能否起到关键作用,哪些是有意义的,是否在目前的认知阶段,有没有必要到-达那么细化的程度?这种从物理到逻辑的做法通常让人失去重点。 此处有个观点。客户属性的分类树并非越细化约好,而是越贴近业务需求的细化程度才是好的。层次分得太深、太细化,反而让人失去重点。譬如在做挖掘建模的时候,经-常听说考虑了几百个变量,其实这些变量之前是如何的层次关系,每个变量反映了什么客户特征,并没有首先从逻辑上给以解释。反正看结果,如果有一个变量有点意思,-再逻辑解释它。当然,这种思路也是挖掘人员一种观点的代表。挖掘是要发现潜在的模式,就不能从现有的知识出发,而是扔进去一些新的变量。这些新变量,可以通过数-据层面上处理就能够生成的。我现在还不好评判这个观点,持怀疑态度。不强求挖掘的变量先逻辑后物理。但挖掘模型反映的重要变量总得逻辑化,加入到分类树里面去的-。 首先在概念层次构建分类树,然后物理化成实际的字段。在开始思考这颗分类树的时候,我总觉得是否只有叶节点才可以物理化的? 非也,其实所有的节点都可以物理化,也就是说每个节点都能用一个具体的值来表示其逻辑含义。举个最极端的例子,分类树的根节点,比较叫做“客户综合属性”。如果-你要问,是否有一个值能够衡量所有客户在所有属性上的概貌?嗯,这不正是聚类解决的问题吗。如果在分群的时候,将客户行为、客户价值、客户生命周期等一堆变量放-在一起聚类,可不就是反映了“客户综合属性”的逻辑含义吗?同理,如果你想知道客户的“长途习惯”是如何的,那么你可以从这个类别的子类别,诸如单次通话、通话-时段、拨号前缀等聚成几类。 说任何节点都是可以物理化的,当然不一定物理化有意义。就像综合所有客户属性分群,分出8群,从数据上看是那么回事。但究竟有多大意义?不知道,也许你会说从宏-观战略程度上看,了解了所有客户的概貌,有意义。可这毕竟是人各有辞,咱不谈意义的事情。 为什么要考虑这个物理化步骤呢? 除了从概念入手对物理实现有帮助之外,物理化这个步骤会让逻辑的分类树简洁。比如一个“长途通话”类别,这是是一个逻辑概念,可以是长途通话次数,长途通话时长-、长途计费时长,这在物理层面有多个,但在逻辑层面,我都可以理解成为是一个衡量长途通话量的属性。 提出物理化还有另一个原因。刚才的例子里面,举出了从时长、次数等不同度量的角度来看待逻辑的“长途通话”,其实不光是度量的不同,还有很多所有类别,或者大部-分类别都有的区分角度。比如在品牌上区分,在时间上区分,在地域上区分等等。比如“长途通话”是一个节点,往下分类的时候,总不能按照品牌,分成全球通、神州行-吧。那样几乎每个节点都得这么分。因此,对于这类共同的区分维度,我想是否可以放在物理化里面,当然,也许不应该叫做”物理化“,倒是应该单独出来一个概念。它-就像后组式分类法一样,是配合这颗分类树的。 不过目前暂且放在”物理化“这个概念里面吧。当分类树中一个逻辑的节点,诸如”长途通话“,可以物理化成为长途通话次数,时长,这是从度量角度区分的。而从时间-角度,可以有长途通话趋势、长途通话幅度,从地区角度,可以有长途通话排名等等。 说到此处,要再次突出逻辑跟物理分离的重要性。我们在术语上有时也应该区别一下。如果提起“字段”、“变量”的字眼,是在物理层面谈事情,而如果提“属性”、“-类别”,将是在逻辑层面说事,而我们一直谈的分类树,是逻辑层面的含义,所以这里才涉及到一个物理化的步骤。 责编:刘庆 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|