论文部分内容阅读
随着固定电话和移动电话的日益普及,电话用户的数量规模逐渐增大。电话呼叫网络和短消息网络是复杂网络在人类社会中的一种具体表现形式,直接的表示了人与人之间的社会网络。它们所代表的电信客户之间的呼叫信息对于电信企业的营销和经营分析,具有重要作用。近年来随着计算机处理能力的增加和数据存储能力的进步,国内外研究人员开始对这些海量的社会网络数据进行处理和分析,并发现这些社会关系网络数据具有某些特别的复杂网络统计结构特征,如“小世界效应”、“无标度特性”等。同时,由于电信运营商之间的激烈竞争,各电信运营商不断推出新的电信产品和业务,对原有的CRM业务支撑系统提出了新的支撑要求。因此电信运营商逐渐开始关注将复杂网络技术和新一代电信软件支撑技术应用于构建灵活的CRM软件架构,并支持海量客户业务运营数据的分析和研究。如何评估客户流失造成的影响、如何提升客户流失预测的效率、如何在海量客户数据上运行流失预测算法、如何找出客户中联系紧密的客户社团、如何构建支持复杂网络分析技术并符合NGOSS软件体系框架的CRM软件,都是电信运营商将复杂网络分析技术应用到CRM需要解决的关键技术问题。本文针对以上关键技术问题,在构建基于复杂网络分析技术的新一代电信CRM的相关研究领域中深入研究了下列问题,并取得了如下成果:1.对电信客户流失后网络统计特性的变化做了系统分析:提出了通过复杂网络统计特性分析电信重要客户的相关方法,针对统计特性指标中节点的主要中心性维度,验证和研究了电话呼叫网络中客户流失与复杂网络相关统计特性的变化规律:度较大的电信客户流失后对该客户所在客户社团的网络容量影响较大;中介中心性较大的电信客户流失后对该客户所在客户社团的网络结构特征影响较大;度较小的客户相对于中介中心性较小的客户更容易流失。以上结论可以用于运营商识别重点电信客户和客户流失预防。2.为了提升电信客户流失预测的效率,本文引入遗传演化对基于心理学扩散模型SPA (Spreading Activation)的流失预测算法进行改进,提出了基于遗传演化的电信客户流失预测算法GASPA (Genetic Algorithm based Spreading Activation).经过在实际数据集上进行测试,发现GASPA算法提高了SPA模型的Lift曲线值,增强了SPA模型的客户流失预测效果。3.为了在海量数据上运行客户流失预测算法,本文提出了流失预测算法GASPA在MapReduce平台上的并行化实现方案M-GASPA (Mapreduce-GASPA)。通过在实际电信呼叫数据集上进行验证,M-GASPA提高了流失预测算法GASPA可处理数据的规模,增强了GASPA算法的性能,并降低了算法运行时间。4.为了找出电信客户中联系紧密的客户社团,提高社团划分精度,本文提出了基于信息熵(Information Entropy)的社团划分算法(简称IE算法)。该算法从信息熵的角度揭示了社团划分中模块度的深层次本质特征。在有着确定社团结构的数据集和不确定社团结构的数据集上,通过选取Q值、社团划分个数、社团最大连通分量大小和强弱社团个数比例四个重要参数,将IE算法与两种最主要的基于模块度的划分算法GN(Girvan-Newman)和FastGN(Fast Girvan-Newman)进行对比,实验结果证明了IE算法在社团划分性能上优于GN和FastGN;将IE和其他七种最主要的经典社团算法进行时间复杂度分析,并在随机网络和真实网络上进行实验,结果表明该算法时间复杂度在GN与FastGN之间,时间复杂度小于GN而精确度优于GN,证明了在大多数数据集上IE算法的社团划分准确度优于传统基于点边比率的社团划分算法的准确度。5.为了构建支持复杂网络分析技术并符合NGOSS软件体系框架的CRM软件,本文提出了符合新一代电信运营支撑理论、集成社会网络分析技术的CRM框架。该框架可集成社团发现IE算法、并行化流失预测算法M-GASPA和并行化中介性算法,并通过结合其他复杂网络算法,进行客户社团发现、客户流失预测、客户维系挽留等相关基本操作,达到精准营销和降低客户流失比例的效果。6.为适应电信行业新业务推出速度快、业务种类多的特点,减少业务逻辑代码的维护工作量,本文提出了基于SOA的省级新一代电信CRM具体构建方法。通过服务原子化方式,将不同业务的数据信息和相关操作封装为格式统一的原子服务,同时原子服务间可以灵活组合或分拆以适应变化的电信业务组合方式,实现了底层业务逻辑代码的高效复用。本文提供了逻辑层次结构、数据建模、原子服务构建方式以及相关实现细节,并给出了构建中基于原子服务的服务定单模型分解实例和处理界面。