论文部分内容阅读
在“客户为向导”的时代,企业实施客户关系管理可以持续与消费者建立良好的互动关系,其经营策略是“卖客户真正需要的产品”。然而,不同的客户其需求各不相同的,只有发掘客户的潜在需求与喜好来开发消费者乐于接受的产品,并通过维系住最有价值的客户群,才能创造更大更多的利润。所以,对客户进行聚类、划分、分群便成为经营者们考虑的首要问题。 面对越来越多的错综复杂的客户信息,借助于数据挖掘技术中的聚类分析,将有助于企业从堆积如山的数据中,发掘更多有利于营销的具有商业价值的信息。 利用聚类分析方法能从数据中找出相关的特征或模式,可以从客户的交易数据中,萃取其消费行为模式,实现对客户进行动态区分,在获得详细的客户区分后,进一步针对个别的客户层进行量身订制的特别营销,希望借此获取其忠诚度,以实现企业经营的最佳化。 针对数据中的异常数值,以及类水平数难以确定的问题本论文提出了一种带约束的最小离差系统聚类法(Restricted Minimum Variance Hierarchical Cluster,RMVHC),其基本思想来自方差分析,即如果分类正确,则类内样品的离差平方和应较小,而不同类间样品的离差平方和应较大。 RMVHC聚类法先对原数据集进行预处理,以削弱不合理数值对聚类过程的影响,然后进行样品间或簇间离差平方和计算,合并最小的两个,一直迭代下去;针对类数难判别的实际问题,采用的是利用检验指标、点图矩阵、主因素分析来综合比较,最终确定分类数的方法。通过测试,该算法对不合理数据有较好的约束作用而且对类数的判别比较客观、有效。在整个建模过程中,可以通过表格直观地看到聚类过程、多种统计技术指标以及随时查看类内和类间的接近程度和距离变化情况,从主分量散点图和树状分类图可以清楚明了看到聚类结果。 为验证模型,先用快速聚类法输入相同变量得到的结果是一致的,通过对考察对象进行特征分析以及部分变量的拟和分析发现,不同群体间的差异程度是比较明显的,其购买行为、购买模式、消费金额和消费习惯是不相同的,说明原模型具有较强的说服力,从而验证了模型的合理性、有效性和实用性。