论文部分内容阅读
随着P2P系统逐渐变成大规模的应用,并且占据着互联网上越来越大比例的流量,关于这些P2P应用程序的实际研究也开始增加起来。P2P系统发展至今,已经出现了各种不同的体系结构,而DHT由于无需中心索引服务器,搜索代价低,能够查找到稀少资源等优点,成为实际应用程序中使用的体系结构。目前实际用户比较多,影响比较大的P2P系统,例如eMule和Bittorrent等,使用的都是DHT结构。已有的研究偏重于P2P和DHT相关的一些理论方面,而kad网作为eMule中使用的DHT,非常具有实际的研究价值。本文以eMule文件共享系统的kad网作为研究中心,结合DHT的理论,通过一系列的测量分析,对kad网,尤其是它的搜索行为进行了全面,系统,而深入的研究,并结合kad网的实现,对kad网的安全性作了充分的分析。
本文的几个主要的贡献方面:
1)使用被动测量对eMule系统的DHT网络kad进行了测量和分析,提出了一种新的数据分析视角,得出了通常的索引容器节点和保存的资源之间的距离关系,为更深入地研究kad网提供了关键的资料。对eMule的kad网络中节点的路由表的规模和变化的剧烈程度随时间的变化进行了分析。在使用kad网进行发布和搜索的整个过程中,分为了两个阶段,即路由查找过程和元信息发布和搜索过程。本文分别对这两个阶段进行了分析,即在路由查找过程中所经过的路由节点和目标的逻辑距离分布情况,以及元信息的发布和搜索阶段中的容器节点和目标的逻辑距离分布的变化。
2)使用主动测量方法对eMule系统进行抓取,并设计出了对应的主动测量网络爬虫。提出了一种适应节点路由表的爬虫算法,能够比已知的方法更高效得获取节点信息。这种网络爬虫以eMule系统中的参与节点的联系信息为抓取目标,通过对kad网络节点的路由表结构进行适应,能够比随机探测的网络爬虫更快更全得抓取到eMule中的节点信息。爬虫设计的算法能够使得爬虫更加灵活,且能够在快速获取已知节点的路由表信息,获取尽可能完全的路由表信息,以及在抓取的总的过程中占用带宽尽可能得少等要求的约束下,对算法做相应调节,以便适应各种环境。
3)针对kad网络的最主要的功能,即元信息的搜索进行了专门的细致的分析。提出了一种新的搜索行为数据搜集方法,和路由节点信息的搜集方法。提出了一种新的路由影响的方法,能够改变kad网对指定目标的搜索路径。通过设置功能和普通的kad节点完全一样的搜索节点,并且设置了多个典型的目标,专门进行搜索会话的收集。每一次搜索会话都记录了所有的信息,能够把搜索会话的情况完全还原出来。通过汇总分析同一个目标在不同的搜索节点和不同的时间上的搜索会话数据,提出了关键节点这一概念。即在kad网上对于某一个特定的目标进行搜索时,搜索会话的路由查找过程总是要经过一些固定的节点,而这些固定的节点根据路由之间的先后关系也能够形成关键路径。
4)对目前eMule中的kad网络的安全性进行了实际的研究,并且结合已知文献中提到P2P的安全问题分析其是否在eMule的kad网中突出。针对kad现有的安全趋势,提出了未来可能的安全威胁的发展方向。eMule目前在安全性的改进方面做了不少努力,但是引起kad网络安全性问题的最根本原因,也就是节点的ID可以随意生成,还是没有发生改变,而节点的ID是和元信息直接相关。因此目前eMule的内在安全机制仍然无法完全保证发布于其中的共享文件元信息的安全性。