论文部分内容阅读
P2P迅速增长的应用和独特的挑战使之成为学术界研究的焦点。随着P2P系统中所存储的数据量的增加以及上层应用对于信息获取要求的提高,要求系统具备强有力的关键词搜索功能。在这方面已经开始了一些研究工作,但很多关键问题还没有解决。本文对结构化P2P系统上的索引切分、文档等级评定、性能优化、可用性、负载均衡等方面进行了研究,取得了一些有价值的研究成果。
本文的主要贡献包括以下几个方面:(1)提出了一种针对结构化P2P系统的索引切分策略MLP(多层次索引切分策略),较好地解决了现有索引切分策略对主干网对分带宽占用过多的问题,有效地降低了通信延迟,提高了吞吐率。
(2)提出了一种基于结构化P2P网络的分布式文档重要性评定策略,能支持结点间以异步通信的方式传递信息,使得在P2P网络上进行文档等级评定成为可能。该策略进一步采用间接传输模式有效地减少了通信开销。
(3)提出了一种基于双层分布式散列表的复合高可用性机制。与传统机制相比,它采用数据冗余和结点自动选择相结合的方法显著提高了系统可用性,且减少了因结点动态性而引起的数据搬移。
(4)提出了一种倒排列表的无损增量求交算法LEIR,它解决了现有增量求交算法不支持某些重要的结果评价函数的问题,在保证搜索精度的前提下减少了查询处理开销。
(5)设计和实现了一个基于v的关键词搜索系统Clairvoyant。与现有系统相比,该系统具有搜索结果更准确、延迟更小、开销更低等特点。