论文部分内容阅读
数据流作为一种新兴的数据管理技术,已经被广泛应用于股票交易、网络流量监控、网络安全监控、实时监控、传感器网络等许多领域。数据流数据是以一种动态的流动的形式存在。数据流模型的主要特点是无界性、随机性和不可预知性,而数据流的应用也往往要求具有一定的实时性。对数据流进行持续查询时,往往感兴趣的不是所有的数据而是最近到达的部分数据,因此对数据流的查询处理大多采用基于滑动窗口的持续查询。定义滑动窗口是数据流管理系统中一个非常基础性的工作,直接关系到数据流的存储和查询的执行效率。
对于那些数据到达是连续的,数据的查询处理是实时的空间应用,例如基于位置交通导航服务,现有的通用的数据流系统由于缺乏对空间数据处理的支持而未能得到广泛的应用。在这样的背景下,结合空间应用及空间数据的特点,提出一种空间数据流系统体系结构,对数据流系统进行空间数据类型、空间操作、空间连续查询的空间扩展。并通过设计实验,验证了扩展后系统的可行性,通过性能分析也证明其在处理空间数据时,相比较于传统数据库有一定的优势。
基于滑动窗口的数据流处理模型关心的往往是最近到达的数据,在不同的时间段所需要的信息往往是处在不同的层次上的。当查询的时间较长时,尤其是在处理空间数据流时,维持如此长时间的窗口消耗系统大量的内存资源,甚至因资源得不到满足而无法执行长时间段的查询。所以,在不同时间段上进行不同粒度的分析是非常必要的。将分层划分的思想和多粒度描述引入到滑动窗口模型中来,用一种分层窗口模型对滑动窗口建模,利用有限的资源维持尽可能长时间的滑动窗口,以支持更长时间段的滑动窗口查询。