XML数据流分页频繁子树挖掘研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:join20102010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML数据流的广泛应用,从挖掘XML数据流中发现知识具有重要的理论与应用价值.相比其他频繁模式挖掘,大型XML文档与数据流的频繁子树挖掘面I临困难:XML数据流不可能整体在内存解析;对XML数据流分段挖掘必须考虑XML数据的半结构化特征等.针对上述问题,提出数据流分页频繁子树挖掘模型Tmlist.Tmlist对XML数据流进行分页,管理跨页节点及频繁候选子树的跨页增长,逐页挖掘频繁子树;频繁候选子树的增长根据根节点层次由浅至深地在最右路径加入频繁候选节点,避免以低层次为根子树的重复性递归增长;对频繁候
其他文献
在大量相似Web服务共存竞争的环境下,基于服务质量的Web服务选择成为服务计算领域的热点问题之一.现有的Web服务选择方法主要研究单个服务请求或多个合作关系的服务请求共同选
在移动计算环境下,无线数据广播是一种可拓展性强、节能、适合用户数量大的信息发布技术.提出了一个在无线数据广播环境下支持空间关键字检索的框架,并提出了一种基于网格索引与倒排表结合的空中索引:IRGI(information retrieval grid index).IRGI的优点是:1)相对文档的大小,索引本身很小,因此可以在一个周期内分布多次索引,以降低访问延迟,增强用户体验效果;2)通过网格索
应用需求的发展衍生各种查询类型,Top—k查询是交互环境下一种重要查询类型.由于数据的不确定性,传统数据上的Top—k查询技术和方法不能直接应用于不确定数据查询.在已有不确定数
Internet资源的动态性使得资源分配问题已成为阻碍Internet资源获得充分利用的一大难题.为方便用户进行Internet应用开发,提出了一个资源动态分配的分布计算模型以及相关的分布
汽车轮毂生产线是典型的制造生产线,大到生产线的总体布局,小到每个硬件设计以及软件设计,需要设计与技术人员不断的探索,提高国内自动生产线的技术水平,满足零件的加工与制
目前,内部控制问题得到了来自政府、企业、市场的高度关注,在这样的背景下,行政事业单位的内部控制体系建设还相对落后,有很大一部分行政事业单位还未能建立一套适合自身发展并且