基于复杂网络分析的新一代电信CRM关键技术研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:gennie_g
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着固定电话和移动电话的日益普及,电话用户的数量规模逐渐增大。电话呼叫网络和短消息网络是复杂网络在人类社会中的一种具体表现形式,直接的表示了人与人之间的社会网络。它们所代表的电信客户之间的呼叫信息对于电信企业的营销和经营分析,具有重要作用。近年来随着计算机处理能力的增加和数据存储能力的进步,国内外研究人员开始对这些海量的社会网络数据进行处理和分析,并发现这些社会关系网络数据具有某些特别的复杂网络统计结构特征,如“小世界效应”、“无标度特性”等。同时,由于电信运营商之间的激烈竞争,各电信运营商不断推出新的电信产品和业务,对原有的CRM业务支撑系统提出了新的支撑要求。因此电信运营商逐渐开始关注将复杂网络技术和新一代电信软件支撑技术应用于构建灵活的CRM软件架构,并支持海量客户业务运营数据的分析和研究。如何评估客户流失造成的影响、如何提升客户流失预测的效率、如何在海量客户数据上运行流失预测算法、如何找出客户中联系紧密的客户社团、如何构建支持复杂网络分析技术并符合NGOSS软件体系框架的CRM软件,都是电信运营商将复杂网络分析技术应用到CRM需要解决的关键技术问题。本文针对以上关键技术问题,在构建基于复杂网络分析技术的新一代电信CRM的相关研究领域中深入研究了下列问题,并取得了如下成果:1.对电信客户流失后网络统计特性的变化做了系统分析:提出了通过复杂网络统计特性分析电信重要客户的相关方法,针对统计特性指标中节点的主要中心性维度,验证和研究了电话呼叫网络中客户流失与复杂网络相关统计特性的变化规律:度较大的电信客户流失后对该客户所在客户社团的网络容量影响较大;中介中心性较大的电信客户流失后对该客户所在客户社团的网络结构特征影响较大;度较小的客户相对于中介中心性较小的客户更容易流失。以上结论可以用于运营商识别重点电信客户和客户流失预防。2.为了提升电信客户流失预测的效率,本文引入遗传演化对基于心理学扩散模型SPA (Spreading Activation)的流失预测算法进行改进,提出了基于遗传演化的电信客户流失预测算法GASPA (Genetic Algorithm based Spreading Activation).经过在实际数据集上进行测试,发现GASPA算法提高了SPA模型的Lift曲线值,增强了SPA模型的客户流失预测效果。3.为了在海量数据上运行客户流失预测算法,本文提出了流失预测算法GASPA在MapReduce平台上的并行化实现方案M-GASPA (Mapreduce-GASPA)。通过在实际电信呼叫数据集上进行验证,M-GASPA提高了流失预测算法GASPA可处理数据的规模,增强了GASPA算法的性能,并降低了算法运行时间。4.为了找出电信客户中联系紧密的客户社团,提高社团划分精度,本文提出了基于信息熵(Information Entropy)的社团划分算法(简称IE算法)。该算法从信息熵的角度揭示了社团划分中模块度的深层次本质特征。在有着确定社团结构的数据集和不确定社团结构的数据集上,通过选取Q值、社团划分个数、社团最大连通分量大小和强弱社团个数比例四个重要参数,将IE算法与两种最主要的基于模块度的划分算法GN(Girvan-Newman)和FastGN(Fast Girvan-Newman)进行对比,实验结果证明了IE算法在社团划分性能上优于GN和FastGN;将IE和其他七种最主要的经典社团算法进行时间复杂度分析,并在随机网络和真实网络上进行实验,结果表明该算法时间复杂度在GN与FastGN之间,时间复杂度小于GN而精确度优于GN,证明了在大多数数据集上IE算法的社团划分准确度优于传统基于点边比率的社团划分算法的准确度。5.为了构建支持复杂网络分析技术并符合NGOSS软件体系框架的CRM软件,本文提出了符合新一代电信运营支撑理论、集成社会网络分析技术的CRM框架。该框架可集成社团发现IE算法、并行化流失预测算法M-GASPA和并行化中介性算法,并通过结合其他复杂网络算法,进行客户社团发现、客户流失预测、客户维系挽留等相关基本操作,达到精准营销和降低客户流失比例的效果。6.为适应电信行业新业务推出速度快、业务种类多的特点,减少业务逻辑代码的维护工作量,本文提出了基于SOA的省级新一代电信CRM具体构建方法。通过服务原子化方式,将不同业务的数据信息和相关操作封装为格式统一的原子服务,同时原子服务间可以灵活组合或分拆以适应变化的电信业务组合方式,实现了底层业务逻辑代码的高效复用。本文提供了逻辑层次结构、数据建模、原子服务构建方式以及相关实现细节,并给出了构建中基于原子服务的服务定单模型分解实例和处理界面。
其他文献
对信息系统数据备份恢复技术进行了研究,提出了一种适用于实时数据库系统的数据备份恢复方法,以解决在生产环境中,不影响上层业务系统的前提下,安全、稳定、高效的数据备份以
社会的发展对供应链管理模式的要求越来越高。作为推动式和拉动式这两种模式下的供应链管理,发挥其管理的规模经济性和响应性成为研究的的重点。在激烈的市场竞争中,需要有效
参照《苏轼文集》中《子姑神记》《天篆记》二文,以及苏轼于元丰三年至元丰六年正月二十日同日诗作,可知《少年游》(玉肌铅粉傲秋霜)一词,应编年于元丰五年(1082年)正月。
近年来,史学界越来越重视对民间文献如宗族谱牒、契约文书、乡规民约、笔记日记等的研究,但对日用账簿研究较少。目前,所研究的明清日用账簿主要见于徽州文书、晋商史料、自
随着社会的发展和经济的增长,城市河流环境所面临的压力越来越大。工业废水和生活污水大量排放,使城市水环境污染日益严重、也破坏了自然生态系统,甚至影响了城市的面貌和市
为了有效地促进产教融合,拉近产学之间的距离,高校在产教融合的推动层面和执行层面都要建立相应的政策保障机制。系统工程理论与TRIZ理论是驱动企业转型和核心技术升级的动力
【正】网络流行语,是指在具有开放性与共享性的网络聊天室、博客、网络社区等网络空间上产生,通过网友的频繁引用、转载及再创作实现传播,并在网络内外长期风行的一种网民约
教学不仅仅是一个"教师提问——学生思考、回答——教师推出答案"的过程。在小学教学中,应当更注重培养学生学习和思考的主动性,让学生独立思考、积极提问。对于数学这一门培养