论文部分内容阅读
客户关系管理(CRM)是最近几年兴起的一个概念,可以从三个层面来理解CRM,它是一种现代的经营管理理念,也是一整套解决方案,同时又是一套应用软件系统.CRM从功能上可以分为三类:运营型CRM、分析型CRM和协作型CRM.其中分析型CRM是CRM的核心,而实现分析型CRM的核心技术是数据挖掘和数据仓库技术.数据挖掘,简单地说,就是从大量数据中提取或"挖掘"知识.数据挖掘是一门交叉学科,涉及到许多学科,它从一开始就是面向应用的,CRM是数据挖掘的一个重要研究与应用领域.数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程.数据仓库是实施CRM的基础.数据挖掘和数据仓库是融合与互动发展的,它们的应用可以大大提升CRM的效率,给企业带来更多利润.聚类分析是数据挖掘的一个重要分支,本文着重于划分算法和高属性维稀疏聚类算法的研究,并研究其在连锁超市CRM中的应用.为了数据挖掘的需要,本文首先构建了一个数据仓库,这也是数据预处理的一部分.接着研究了划分算法,针对划分算法对输入顺序和初始值敏感等缺陷,提出了一种动态的聚类算法(Partition-based Dynamic Clustering Algorithm,缩写为PDCA):根据数据对象的密度大小排序,选取相隔较远的数据对象作为初始值,并根据给定的参数,在聚类的过程中动态地调整聚类个数,从而使聚类结果更加稳定、合理.然后将PDCA算法应用于客户细分,进行客户价值分析.本文还对基于稀疏特征向量的聚类算法(Clustering Algorithm Based On Sparse Feature Vector,缩写为CABOSFV)进行了研究,发现其对输入顺序敏感、算法很不稳定、聚类质量不高等不足之处,因此,本文提出了集合的相似属性的概念,并且扩展了差异度的计算方法.最后将改进算法应用于客户购物模式分析,实践表明改进算法能够发现更好的知识.