【摘 要】
:
随着数据采集技术和数据处理技术的发展,人们对数据不确定性的认识逐渐深入。由于测量误差、设备精度、保密措施等各种因素的影响,数据表现出固有的不确定性,这种数据被称为
论文部分内容阅读
随着数据采集技术和数据处理技术的发展,人们对数据不确定性的认识逐渐深入。由于测量误差、设备精度、保密措施等各种因素的影响,数据表现出固有的不确定性,这种数据被称为不确定数据。由于现在大部分数据挖掘技术研究主要作用于确定性数据,当将其运用到不确定数据时,会忽略不确定数据的概率维度,致使挖掘效果不够理想。所以如何从不确定数据集中挖掘出有价值的信息成为一个新的研究热点。在对现有的数据挖掘系统进行详细的问题分析和需求分析的基础上,本文设计了一个基于不确定数据的数据挖掘系统,重点研究了不确定数据挖掘技术中离群点检测技术和频繁项集挖掘技术。根据不确定数据的特点,提出了不确定数据的top-k离群点检测算法VGUOD和不确定数据的加权频繁项集挖掘算法WCUFP-Mine。在二维数据空间中,针对已有的基于距离的不确定数据离群点检测算法参数设置困难,在大数据集上扩展性差的问题,采用top-k思想对不确定数据离群点的概念进行重新定义,运用动态规划思想计算离群概率,有效减少了计算量,在此基础上提出了基于虚拟网格聚类的剪枝方法,极大降低了算法的时间复杂度。为了提高不确定数据频繁项集挖掘算法的实用性,本文在CUFP-Mine算法的基础上提出了一种不确定数据的加权频繁项集挖掘算法WCUFP-Mine。该算法为数据集中每个项引入一个权重值,并改进了CUFP-Mine算法的建树方式,有效减少了树形结构的规模,提高了挖掘效率。最后,将基于不确定数据的数据挖掘系统作为子模块运用于VTS故障管理子系统中,实现了系统的设备故障报警和故障分析等功能。初步应用效果证明本文所提出的不确定数据挖掘技术能够有效提高系统的性能和可靠性。
其他文献
为了保护少数民族文化遗产,本文利用三维建模软件Multigen Creator和实时仿真软件Multigen Vega开发了一个少数民族文字“女书”虚拟碑林园视景仿真漫游系统,研究了视景仿真
随着计算机科学技术的发展,二维条码技术在物流、自动化生产、国际贸易、电子商务等各领域被广泛应用。二维条码以其信息量大、面积小、防伪和抗污染能力强在信息采集、信息
计算机接口技术的迅速发展,促进了电子测量仪器的发展,新的总线逐步应用到仪器领域。新总线的优良特性为测试工作带来便利,同时也使自动测试系统向混合总线测试系统发展。本文介
无线传感器网络涉及传感器技术、嵌入式技术、通信技术、分布式信息处理技术以及微机电技术等众多学科,已被广泛应用在军事、医疗、交通、环保等领域。在救灾、探矿等领域中,
随着网络技术地持续发展,以网络为媒介的分布式远程教学正在走出传统教学的框架,逐步改变了“教”与“学”的方式。体现以学生为主体、老师为主导,构建学生充分参与及自主学习的
本文主要研究抗打印扫描的数字图像水印算法,通过分析抗打印扫描数字水印算法的研究现状,设计一种较为完善的抗打印扫描的数字水印系统,并使之能够有效的应用于硬拷贝图文的
随着航运船舶数量的逐年增加,人们对船舶航行安全的要求也在不断提高。对船舶设备运行状态进行实时监控是确保船舶安全运行的主要技术手段之一。由于船舶设备数量大、型号多
随着网络的普及和发展,互联网已经成为人们生活、学习、工作、娱乐的重要途径。互联网作为信息载体,近年来以惊人的速度在增长,信息量以TB计算,拥有上千万个网站、数十亿的用
目前面向动态模糊数据的聚类分析研究的还比较少,为此,在动态模糊逻辑理论基础上,结合传统的聚类分析和模糊聚类分析理论,本文对面向动态模糊数据的聚类分析算法做一些尝试研
当前基于信任计算的应用越来越多,涉及网络通讯、网络购物甚至是网络金融等众多与人们日常工作生活息息相关的领域,信任计算已经成为了各类网络应用中的重要一环。然而,针对