深度研究Kad网

来源 :北京大学 | 被引量 : 0次 | 上传用户:billguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着P2P系统逐渐变成大规模的应用,并且占据着互联网上越来越大比例的流量,关于这些P2P应用程序的实际研究也开始增加起来。P2P系统发展至今,已经出现了各种不同的体系结构,而DHT由于无需中心索引服务器,搜索代价低,能够查找到稀少资源等优点,成为实际应用程序中使用的体系结构。目前实际用户比较多,影响比较大的P2P系统,例如eMule和Bittorrent等,使用的都是DHT结构。已有的研究偏重于P2P和DHT相关的一些理论方面,而kad网作为eMule中使用的DHT,非常具有实际的研究价值。本文以eMule文件共享系统的kad网作为研究中心,结合DHT的理论,通过一系列的测量分析,对kad网,尤其是它的搜索行为进行了全面,系统,而深入的研究,并结合kad网的实现,对kad网的安全性作了充分的分析。   本文的几个主要的贡献方面:   1)使用被动测量对eMule系统的DHT网络kad进行了测量和分析,提出了一种新的数据分析视角,得出了通常的索引容器节点和保存的资源之间的距离关系,为更深入地研究kad网提供了关键的资料。对eMule的kad网络中节点的路由表的规模和变化的剧烈程度随时间的变化进行了分析。在使用kad网进行发布和搜索的整个过程中,分为了两个阶段,即路由查找过程和元信息发布和搜索过程。本文分别对这两个阶段进行了分析,即在路由查找过程中所经过的路由节点和目标的逻辑距离分布情况,以及元信息的发布和搜索阶段中的容器节点和目标的逻辑距离分布的变化。   2)使用主动测量方法对eMule系统进行抓取,并设计出了对应的主动测量网络爬虫。提出了一种适应节点路由表的爬虫算法,能够比已知的方法更高效得获取节点信息。这种网络爬虫以eMule系统中的参与节点的联系信息为抓取目标,通过对kad网络节点的路由表结构进行适应,能够比随机探测的网络爬虫更快更全得抓取到eMule中的节点信息。爬虫设计的算法能够使得爬虫更加灵活,且能够在快速获取已知节点的路由表信息,获取尽可能完全的路由表信息,以及在抓取的总的过程中占用带宽尽可能得少等要求的约束下,对算法做相应调节,以便适应各种环境。   3)针对kad网络的最主要的功能,即元信息的搜索进行了专门的细致的分析。提出了一种新的搜索行为数据搜集方法,和路由节点信息的搜集方法。提出了一种新的路由影响的方法,能够改变kad网对指定目标的搜索路径。通过设置功能和普通的kad节点完全一样的搜索节点,并且设置了多个典型的目标,专门进行搜索会话的收集。每一次搜索会话都记录了所有的信息,能够把搜索会话的情况完全还原出来。通过汇总分析同一个目标在不同的搜索节点和不同的时间上的搜索会话数据,提出了关键节点这一概念。即在kad网上对于某一个特定的目标进行搜索时,搜索会话的路由查找过程总是要经过一些固定的节点,而这些固定的节点根据路由之间的先后关系也能够形成关键路径。   4)对目前eMule中的kad网络的安全性进行了实际的研究,并且结合已知文献中提到P2P的安全问题分析其是否在eMule的kad网中突出。针对kad现有的安全趋势,提出了未来可能的安全威胁的发展方向。eMule目前在安全性的改进方面做了不少努力,但是引起kad网络安全性问题的最根本原因,也就是节点的ID可以随意生成,还是没有发生改变,而节点的ID是和元信息直接相关。因此目前eMule的内在安全机制仍然无法完全保证发布于其中的共享文件元信息的安全性。
其他文献
本文的课题背景为国家自然科学基金“多关系频繁模式挖掘模型、方法库的知识发现机理、模型与算法研究”(项目批准号:60875029)。   多关系数据流环境,是一种现实存在而又复
研制具有千万亿次计算能力的并行计算机系统是当前的重大挑战之一。曙光5000高效能计算机系统是中国科学院计算技术研究所国家智能计算机中心开发的面向千万亿次计算的超级计
说话人识别是根据语音信号中反映说话人生理和行为的个性特征自动鉴别说话人身份的一种生物认证技术,可广泛应用于电话银行、数据库访问、计算机远程登录、安全验证、自动控
在全超导非圆截面核聚变实验装置EAST大科学工程中,包含了很多个子系统,不同系统之间需要进行数据交换,分工合作。如在分布式计算环境中,由于每个主机时间不同步,会造成同一
学位
如何保证软件系统的正确性一直是人们所关注的问题,为了能够准确、快速地找到软件系统中存在的问题,研究者们研发出了对软件系统进行形式化验证的工具。在本文中,我们将使用FeaV
运动目标检测是当前图像技术研究应用的热点和焦点,作为运动目标视觉分析中的一项核心技术以及底层问题,是后续各种高层次的视频处理和应用理解的基础,同时也是视频监控技术自动
随着信息技术的发展,人们越来越强烈地希望用自然语言同计算机交流信息。如果计算机能够“理解”自然语言,用户就能够通过自然语言使用数据库、专家系统、管理信息系统等各种软
近十年来,统计机器翻译取得了很大的成功。统计机器翻译过程实际上是很复杂的流程,涉及了许多自然语言处理技术,如:分词、词性标注、句法分析、词语对齐等。该流程中,每个模块都输
移动机器人越来越多地应用到各个行业中,移动机器人具有高度自规划、自组织和自适应能力,适合于工作于复杂的非结构化环境中,路径规划是机器人技术研究领域中的核心问题,它的
学位
生物信息学是一门以计算机技术为核心工具对生物信息进行存储、解析以及统计分析的科学。计算机技术的快速发展,尤其是大数据技术、机器学习以及数据挖掘技术的兴起,给传统的生