基于对等网络的关键词搜索研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:shanghairenxuchenhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P迅速增长的应用和独特的挑战使之成为学术界研究的焦点。随着P2P系统中所存储的数据量的增加以及上层应用对于信息获取要求的提高,要求系统具备强有力的关键词搜索功能。在这方面已经开始了一些研究工作,但很多关键问题还没有解决。本文对结构化P2P系统上的索引切分、文档等级评定、性能优化、可用性、负载均衡等方面进行了研究,取得了一些有价值的研究成果。 本文的主要贡献包括以下几个方面:(1)提出了一种针对结构化P2P系统的索引切分策略MLP(多层次索引切分策略),较好地解决了现有索引切分策略对主干网对分带宽占用过多的问题,有效地降低了通信延迟,提高了吞吐率。 (2)提出了一种基于结构化P2P网络的分布式文档重要性评定策略,能支持结点间以异步通信的方式传递信息,使得在P2P网络上进行文档等级评定成为可能。该策略进一步采用间接传输模式有效地减少了通信开销。 (3)提出了一种基于双层分布式散列表的复合高可用性机制。与传统机制相比,它采用数据冗余和结点自动选择相结合的方法显著提高了系统可用性,且减少了因结点动态性而引起的数据搬移。 (4)提出了一种倒排列表的无损增量求交算法LEIR,它解决了现有增量求交算法不支持某些重要的结果评价函数的问题,在保证搜索精度的前提下减少了查询处理开销。 (5)设计和实现了一个基于v的关键词搜索系统Clairvoyant。与现有系统相比,该系统具有搜索结果更准确、延迟更小、开销更低等特点。
其他文献
图象分割是计算机视觉研究中的基本问题,而运动和纹理则是赖以进行图象分割的关键信息。传统的研究方法中通常孤立地探索二种信息在图象分割的作用。本文研究纹理和运动信息在
本文通过研究和利用一个优秀的面向对象的设计模式和框架:ACE(ADAPTIVE Communication Environment),介绍了开发多媒体会议的技术,该多媒体会议使用了SIP信令控制协议,同时也
文中首先介绍了分布对象技术的概念、现状和发展动态以及目前流行的主流技术.然后谈及Web技术及发展,并且结合Java语言特有的优势,具体阐述了Web技术的Java实现.最后结合中石
随着Internet的普及和迅速发展,基于网络的应用越来越多,对性能的要求也越来越高.组播应用是网络应用的一个重要方面,同时,组播也是一个高效的网络数据传播模型.国际上对IP组
企业安全生产管理中的重要手段之一是调度系统,在工业界、企业界、交通运输管理、公安和消防等多数部门中,时时需要用调度系统来快捷的指挥以及调度人力和物资,迅速的传递命令和
数字化作为当今时代的特征,正越来越影响着人们生活的方方面面。随着电子商务、电子政务和办公自动化的发展,基于生物测定学的生物认证技术越来越受到人们的重视。凭借传统签名
随着高性能计算机、快速信息交互网络的出现,分布式人工智能、计算机协同工作、数据挖掘和数据仓库等高新技术的迅猛发展,基于主体的智能协作信息系统越来越多地出现在人类社
实际应用领域中存在大量的序列数据,这些序列数据中隐藏着丰富的有价值的知识。如何在序列数据库中挖掘频繁出现的序列模式,是序列模式挖掘的重要任务。随着信息技术的高速发
随着计算机技术的飞速发展,信息成为企业最重要的生产要素和战略资源,企业的生存和发展,离不开管理,而管理的核心内容,是对各种信息的处理,由于企业的管理信息非常复杂,而且这些信息
远程教育已经在全国所有高校开展起来,逐渐成为高等院校教育的一个分支,异地的学生可以通过远程教育的一些传播手段,收听和收看相关的教学课程,达到学习的目的,但目前的远程教育发