论文部分内容阅读
本文提出用决策树的方法进行移动通信领域的客户流失分析,对其中存在的问题进行了研究和探讨,并把研究结果应用于原型系统。主要工作内容和成果可以概括为以下几个方面:
1.提出并设计了适合决策树算法的数据预处理机制。数据预处理阶段对于数据挖掘至关重要,探讨了针对移动通信数据需要特殊考虑的问题。采用“样本放大”方法进行抽样可以强化流失用户的特征;针对决策树算法无法处理与时间相关属性的弊端,提出了趋势属性的概念并给出了采用带权最小二乘法生成趋势属性的方法。
2.构建了基于决策树算法的流失分析模型。决策树算法作为一类成熟稳定的算法已经有多个版本的实现,我们采用了使用广泛的C4.5算法。针对该算法,允许动态调整的参数包括树叶最小结点数、验证策略、剪枝方法等。
3.设计并实现了移动通信客户流失分析原型系统。该原型系统包括数据库连接、数据预处理、模型参数调整、模型管理、模型展现、预测、性能展示等功能模块。
通过以中国移动的实际数据作为基本数据源,对原型系统进行了验证,证实该系统具有较高的准确性和可用性,特别是系统提供的数据预处理机制对于提高流失分析模型的性能具有重要意义。