【摘 要】
:
该文以数据预处理阶段中属性子集的选择问题、属性约简问题和连续属性离散化方面 为主要研究内容.在属性子集的选择上,作者提出利用信息熵作为识别相关属性的度量标准.在属性
论文部分内容阅读
该文以数据预处理阶段中属性子集的选择问题、属性约简问题和连续属性离散化方面 为主要研究内容.在属性子集的选择上,作者提出利用信息熵作为识别相关属性的度量标准.在属性约简问题上,提出了结合用户背景知识,以粗糙集合属性重要度为启发式评价函数的求解最佳约简的算法,并针对粗糙集合对数据躁声敏感的弱点,提出了利用不确定信息系统处理有躁声环境中的属性约简问题.连续属性的离散化一直是知识发现领域中被人所忽略的内容,国内也鲜见有与之相关的文章.作者在分析了大量现有的离散方法的基础上,提出一种基于区间相似度的离散化方法,该方法具有简单、直观、适用于大规模数据库的特点.基于以上的研究,作者在WINDOWS 95/98平台上开发了一个面向关系数据库的知识发现原型 系统-K-PRO.该系统主要用于发现分类规则.
其他文献
该文介绍了作业管理系统设计和实现中的一些具体技术问题.主要内容包括:1.JobCenterNT系统整体设计.2.JobCenterNT系统安全性的设计与实现.提出了在WindowsNT平台上满足安全
该文首先介绍了图像信息检索系统的体系结构,它能够有效地支持多图像信息的建立、检索和维护.接下来较详细地介绍了其中的关键部分:特征提取.讨论了图像的颜色和形状这两种特
该文的主要内容就是研究近年来国际上比较热门的一个研究方向--网络存储.第一章介绿了网络存储的起因以及当前国际上的发展方向和研究意义;第二章主要阐述了目前比较流行的一
随着技术的进步,计算机越来越广泛的应用于工业、农业、科研及人民生活的各个领域.数据库技术应用是计算机应用的重要组成部分.为了满足实际应用的需要,迫切要求充实数据库理
在地质领域,科学可视化技术具有十分重要的地位.借助于可视化图形,研究人员可以对地质变量的分布和变化趋势产生直观的理解,这对于矿藏的勘探、开发和后续处理工作有着重要的
IP电话的核心是IP网关,该课题的任务就是设计IP网关.它处于PSTN网和数据网之间,成为两种网络间的桥梁.研究人员使用No.1信令与程序交换机通信,在概论之后,论文详细介绍了信令
该文研究如何完整表示设计模式并将它应用于软件设计过程,从而发挥它对设计的潜力,使设计过程越来越确定、越来越成熟.该文首先分析了设计模式本质,指出它是一个面向软件设计
论文就微行星齿轮减速器的选型进行了分析,采用了微3K-2型行星齿轮减速器;对微行星齿轮减速器的配齿与建模进行了设计;对微齿轮的建模方法进行了讨论,提出了一种较好的、符合
该文介绍了智能卡的软硬件知识,主要是智能卡的内部结构,文件组织及一些关键操作.针对智能卡在信息存储、信息保密和信息认证方面的特性,突出了智能卡在现实世界信息安全和信
该文围绕着大规模散乱数据可视化中的问题,分别用层次B-样条曲面和多尺度分析技术,对大规模散乱数据进行表示.作者在该文中提出的自适应层次B-样条曲面逼近是针对在实际应用