随机型分形维数计算方法及其在数据流聚类中的应用研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:dzbycp2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分形数据挖掘技术是一种利用数据集的分形特征对其进行挖掘的技术,所谓数据集的分形特征是指一个数据集的部分分布与整体分布具有相似的结构或属性。描述数据集分形特征的重要指标是分形维数,分形数据挖掘一般是基于分形维数的。本文对分形数据挖掘技术中的基本问题及其在数据流环境中的应用问题进行了研究。   分形数据挖掘技术以数据集的分形特征为基础,现实的数据集中一般存在着近似的或统计性质上的分形特征,其近似的分形特征存在于无标度区间内,无标度区间的大小反映了数据集的精细程度,位于无标度区间内的点近似于一条直线,这些点近似于直线的程度可以度量数据集体现的自相似程度,本文基于移动盒计数法和多层网格结构的划分方法对无标度区间及不同划分粒度下的最小覆盖集进行了精确度量。   分形维数在数据挖掘领域有着特殊的作用,它能有效地描述数据集,能反映复杂数据集中隐藏的规律性,分形维数是一个特殊的指标量,当它发生变化时,往往说明数据集的某些特征发生了变化,如数据点分布,数据集的变化趋势等,基于分形理论的数据挖掘算法通常都涉及到分形维数的计算,因此分形维数的计算方法是分形数据挖掘技术要解决的首要问题。但是现有的分形维数计算方法时间复杂度和空间复杂度都比较高,这大大降低了算法的效率,使算法很难适应高速、海量的数据流环境。本文总结分析了现有的几种分形维数计算方法,将分形维数的计算方法分为确定型算法和随机型算法两种类型,并提出一种灵活高效的随机型算法来估计数据流的分形维数。最后,以随机型分形维数计算方法为基础,研究了分形数据流聚类方法。
其他文献
期刊
余秋雨(著名学者):看他的作品,精细的工艺中总是透露着无法遮掩的大气和雅致,这便是长年的传承、历史的结晶。他还那么年轻,正可谓前途无量。沈其斌(上海证大现代艺术馆馆长)
期刊
一、良繁工作的现状江西是全国重点产棉省之一。建国以来,全省棉花良种培育工作取得较大成绩,共培育棉花品种22个,彭泽3号和彭泽4号曾被列为向国家推荐优良品种,彭泽1号为国
最近,一位中央领导同志不无痛切地指出,我们的新闻不象新闻,连起码的五个“W”都不具备。笔者近日看报,一连发现新的佐证,姑举三件: 3月16日,一家专业报纸最先报道国家男子
EVA,即经济增加值(Economic Value Added)能够真实地反映企业创造了多少价值,并且可以作为绩效考核来协调股东和经营者的利益。而EVA的一个明显特征是重视资本成本,尤其是股权资本
期刊
组合预测是Granger和Bates提出的一种全面利用各种预测方法所挖掘信息的预测理论。经过几十年的发展,组合预测理论已经日渐成熟。众多学者的研究结果表明,组合预测能提供比单
7464-87-1-2-2该品系是甘肃省天水地区农科所甘谷试验站于1974年以67-13-88[65-5356B×(阿勃×老芒麦F_5]为母本,高加索为父本杂交选育而成。半冬性,千粒重40克左右,株高90
配合在全省城乡开展的社会主义教育运动,辽宁日报从六月下旬起,在第三版开辟了《忆苦思甜》的专栏,刊登村史、厂史、工农劳动群众的家史和个人血泪史等稿件,受到了广大读者