面向电信领域的数据挖掘关键技术研究

被引量 : 0次 | 上传用户:kmyzkmyzkmyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电信行业竞争的不断加剧,数据挖掘作为一种知识提取和决策支持的手段,已得到了广泛的应用。然而,由于电信企业数据采集系统人为和非人为的扰动,造成各个数据源的数据质量参差不齐,加之数据仓库的ETL机制本身的某些问题,导致在数据集成时发生数据缺失和错误,造成数据的整体质量不高,从而对数据挖掘的结果产生影响。因此,合理地解决上述问题,提高数据挖掘的准确性和效率,利用数据挖掘技术促进电信领域各类业务的正常运行,具有重要的实际意义。虽然人们对电信领域的数据挖掘技术进行了近十多年的研究,提出了若干技术并试图解决电信领域数据挖掘技术在应用中遇到的各类问题,但这些技术并没有很好地适应电信领域数据复杂多样和规模庞大的特性。本文以电信实际业务数据特征为研究对象,以提高电信领域数据挖掘效能为研究内容,从数据挖掘方案的实用角度出发,深入研究了可满足电信领域数据挖掘准确性、效率和决策支持等多方面需求的数据挖掘技术。本文的创新工作主要包括以下几个方面:首先,结合电信数据规模异常庞大,管理极具复杂性的现实情况,提出一种高效、准确的数据挖掘方案。为了提高K均值方法知识发现的准确性,分别提出运用遗传算法优化初始值空间,以及通过加权方式获得子空间内最有价值知识的方案。其次,按照电信领域知识发现的实际需求,在面临数据规模呈几何模式增加时,数据挖掘算法的效率会持续下降,数据挖掘网格作为一种有效的解决手段,提出了基于网格技术的并行计算调度方案,并对方案进行了性能分析。最后,随着3G网络时代的快速发展,电信用户网络访问行为数据规模以每天几十T级的数量激增,传统的计算方式早已无法适应这种数据场景。引入Hadoop平台等云技术手段,合理解决数据存储问题。从实际的应用角度出发,设计出对应的数据挖掘算法。提出了对传统的决策树SPRINT算法进行改进,提出了并行化计算方案,并成功应用到Hadoop平台。
其他文献
随着海洋油气资源开发向深海发展的必然性,水下生产系统成为必须掌握的技术。采用水下生产系统完成深水油气资源的开采、输送是该领域的主要方向。海底管道是水下生产系统的重
数控机床是典型的机电一体化系统,随着数控技术的迅速发展,数控机床的普及日渐成为机械行业的潮流。这对数控机床制造行业在研发、生产、维护等方面如何提高效率、提高质量提
近几年来,随着对海洋资源的开发和利用,自主水下航行器(AUV)的研究成为一个热门的领域。一方面,它可以减少人类下潜的危险,完成一些人类不能完成的任务,另一方面它可以随意地在海
航运经济发展及利益驱使各国不断完善其海事领域的法律及扩大国际影响力。在拥有广袤蓝色国土的我国,为了实现国家促进与管理海运的目标,为海上商业活动提供法律框架,需制定海上
中国高等教育研究的认识论中存在着“学科论”与“领域论”的学科属性之争,由此导致高等教育的学科化研究和高等教育的多学科研究两种研究方法。高等教育的学科化研究直指高
<正>中国新闻奖是经中央批准常设的全国优秀新闻作品的最高奖,由中华全国新闻工作者协会主办,获奖作品代表着中国新闻界对新闻工作者业务能力和水平的最高评价。因此,中国新
逆变器同整流器一样是电力变换装置的重要组成部分,广泛应用于工业、航空电源、民用等各个领域。随着科学技术的不断发展、发电和用电设备的不断增加,对电力变换装置的容量、安
大学理想和理念的研究是近年来在我国兴起的一个热点问题。与西方大学理想和理念的研究相对比,这一研究领域中存在着诸多有趣的现象,涉及这一研究兴盛的背景、研究者的特征和
汉魏之间社会发生了重大变化,儒学为玄学所代替,社会由大一统向大分裂转变。而儒学为玄学所代替这一过程则是社会大背景下思想文化领域的重大变化。思想的发展有其内在的规律
近年来,由脑中风后遗症,脊髓损伤,肌肉、神经和大脑病变以及自然和人为灾害引起的手部功能残疾患者逐年增多,为了解决我国手部残疾患者的饮食护理问题,本文对助餐机器人进行了研究