论文部分内容阅读
随信息技术的发展,数据挖掘技术得到了广泛的关注,学者们对该技术进行了深入的研究,各种数据挖掘算法日趋成熟。同时,数据挖掘技术在通信、零售、银行等领域得到了广泛应用,如通信行业开展的的交叉销售、离网预警专题,银行开展的信用欺诈专题等,这些数据挖掘项目的开展给企业带来了极大的经济价值,同时也验证和发展了数据挖掘理论。关联规则是数据挖掘技术中的一个重要的研究方向,关联规则算法是关联规则挖掘研究的主要内容,迄今为止已经有很多学者对关联规则进行了研究。大多数学者都是从如何提高关联规则算法的效率的角度对Apriori算法进行了积极、有效的改进,但很少有人是从挖掘出有商业价值规则的角度进行讨论,本文就是从数据挖掘规则实际应用的角度、从如何产生更有商业价值的规则的角度,对关联规则挖掘进行了研究与改进。
本文重点是结合WAP交叉销售这个项目的需求,对关联规则挖掘算法进行研究与改进,建立WAP交叉销售模型。首先,对WAP交叉销售、交叉销售中的数据挖掘技术进行了系统的分析,针对现有数据挖掘算法无法结合“客户细分”这一专题的成果,给出了WAP交叉销售的一种改进模型:然后,对Apriori关联规则算法进行了系统的分析和总结,分析了其优缺点,针对其缺点,提出了一种基于SQL的Apriori改进算法;结合“客户细分”的思想,发展了WAP交叉销售模型中的相关性分析模型,为此,提出了一种基于半布尔矩阵的混合维关联规则算法;针对WAP交叉销售模型中的预测模型,放弃了当前流行的决策树算法,采用了分类关联规则算法,解决了当前分类算法产生的规则缺乏价值衡量指标等问题,为WAP交叉销售模型的工程实现做好了算法的理论准备。最后,对WAP交叉销售模型的工程实现进行了概要设计、详细设计,给出了各种算法的主要实现思路及方法,并给出了一种良好的规则可视化的展示方式,使得决策者可以很容易的理解规则的意义。