论文部分内容阅读
随着数据仓库技术和OLAP技术的发,人们提出了联机分析处理和数据挖掘技术集成的多维挖掘技术。多维数据挖掘能使得用户能够选择相关数据的任何部分,在不同的层次上分析数据。本论文结合粗糙集与决策树技术的研究多维数据挖掘方法。
面对决策树技术和粗糙集各自的优缺点,在研究过程中将这两者结合起来取长补短。对于仅有离散值属性的情况下,利用粗糙集理论对数据集进行属性约简。本文提出了一种基于信息熵的属性约简算法。该算法很大程度上改进了属性约简的效率。在此基础上本文提出基于粗糙集和决策树技术结合的数据挖掘算法。该算法大大减小了决策树的规模从而使数据挖掘的效率有所提高。
最后本文利用结合粗糙集和决策树技术的数据挖掘算法设计了一个多维数据挖掘系统,并实现了这个基于sqlserveranalysisserver开发的多维数据挖掘系统。