基于决策树算法的移动通信客户流失分析系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:zjr_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出用决策树的方法进行移动通信领域的客户流失分析,对其中存在的问题进行了研究和探讨,并把研究结果应用于原型系统。主要工作内容和成果可以概括为以下几个方面: 1.提出并设计了适合决策树算法的数据预处理机制。数据预处理阶段对于数据挖掘至关重要,探讨了针对移动通信数据需要特殊考虑的问题。采用“样本放大”方法进行抽样可以强化流失用户的特征;针对决策树算法无法处理与时间相关属性的弊端,提出了趋势属性的概念并给出了采用带权最小二乘法生成趋势属性的方法。 2.构建了基于决策树算法的流失分析模型。决策树算法作为一类成熟稳定的算法已经有多个版本的实现,我们采用了使用广泛的C4.5算法。针对该算法,允许动态调整的参数包括树叶最小结点数、验证策略、剪枝方法等。 3.设计并实现了移动通信客户流失分析原型系统。该原型系统包括数据库连接、数据预处理、模型参数调整、模型管理、模型展现、预测、性能展示等功能模块。 通过以中国移动的实际数据作为基本数据源,对原型系统进行了验证,证实该系统具有较高的准确性和可用性,特别是系统提供的数据预处理机制对于提高流失分析模型的性能具有重要意义。
其他文献
随着互联网的飞速发展,由于其开放性,在方便人们获取信息的同时,各种不良信息也随之泛滥,特别是反动、色情、暴力等有害信息极大地危害着社会的稳定和人们的身心健康,网络内
Internet承载的多方实时通信服务和相关技术是目前工业界和学术界关注的热点话题,H.323和会话初始化协议(SIP)是其中两个关键的信令协议。会话初始化协议由于其灵活性、可扩展
工作流管理系统在企业的事务处理流程和资源管理中的优势使其倍受关注。而工作流建模工具涉及到工作流程的抽取、图形化表示、以及流程验证等,是实施工作流管理系统的关键环节
地质图空间数据库建设是数字国土工程主要任务之一,它对于国土资源管理、国民经济建设、地质调查和研究工作,具有广泛而重要的意义。当空间数据库建成以后,这些空间资源大多是存
离散制造企业中,优化生产调度是缩短产品生产周期、提高企业按期交货能力的重要举措。为此,本文将从生产控制模型、车间作业调度算法及研制车间调度管理软件三个方面来对这个
渠道运行控制系统是一个大型和复杂的控制系统。任何一项供水工程,必须满足的基本要求之一是适时与适量的供水。它的目的在于提高渠道的调度水平和输水效率,避免供水的不足与
  目前我国采煤业普遍使用的采煤机现代化程度很低,采掘效率低,在有效保障生产安全上也存在问题。主控系统是采煤机的大脑,提高采煤机的现代化程度,关键是更新其主控系统。随着
工作流技术是进入90 年代以后计算机应用领域的一个新的研究热点。 对工作流技术进行深入的研究对于提高我国企业的信息化程度、运行效率以及竞争能力都有着重要的意义。我们
随着Deep Web中数据的增多,深度网络所包含数据的检索变得尤其的重要。事实上大部分信息对传统的搜索引擎是不可见的。为了使搜索引擎对于深度网络的查询效率更高,通过数据标
网格作为Internet的第三次浪潮,有望提供下一代分布式应用和服务。网格是以Internet作为通信支撑平台,而Internet是一个开放性、异构性极大的公共网络,这就使得在Internet上