KAD DHT的网络特征与节点行为的测量研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:duchze
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,关于分布式哈希表(DHT)的研究非常多,有通过模拟仿真、理论分析等方法的,也有从实际测量角度出发的。eMule中基于Kademlia算法的KAD网络是当前最大规模的DHT实现,任何时刻同时在线节点数保持在几百万级别,因此尤其受到大家关注。本文在对KAD DHT进行主动测量的基础上,对KADDHT的网络特征与节点行为进行了测量研究。   采用主动测量的方法是设计爬虫程序,在尽量短的时间内抓取KAD中尽量多的在线节点信息。本文设计了KAD爬虫程序,并着重从提高抓取节点的查重效率、种子节点的选取、快速获取路由表中节点、提高发送接收速度等方面对爬虫程序进行优化,获得了较高的KAD节点抓取速度。在优化过程中设计了模拟普通KAD节点的种子程序,并发现当KAD节点的路由表在1-2小时稳定后,其保存的节点个数保持在700-800左右,最大层数保持在19-20左右。   主动测量包括2次全局抓取测量和每5分钟一次共持续4天的有代表性的某区域进行抓取测量。通过对KAD进行全局抓取和区域抓取,建立了丰富的测量数据集,为相关研究提供了分析依据。   全局抓取测量获得了节点的地理分布、KAD ID的地址空间分布,并发现了KAD中存在的2种异常现象,初步探讨了形成原因。区域抓取测量描绘了节点的到达与离开率,发现其满足负二项式分布;描绘了节点的会话长度,发现其满足对数正态分布和Weibull Distribution;描绘了节点的在线时间和离线时间,发现在线时间满足Weibull Distribution:描绘了节点的每天在线比率与每天上线次数;并对同一节点的会话长度之间、在线时间之间、每天在线比率之间与每天上线次数之间的相关性进行了分析。通过这些测量指标对节点的动态行为进行了深入研究,发现了蕴含其中的数学规律并探讨了形成原因。   最后,根据测量结果对设计与实现新KAD给出了帮助与建议。论文的测量分析结果为研究人员更好地理解KAD DHT的网络特征与节点行为提供了有益的参考数据,对研究人员进一步完善KAD具有较好的参考价值。
其他文献
强制访问控制能有效地防止用户有意或无意地破坏系统的安全,能够有效地防止病毒和木马以用户的身份破坏系统的安全,是高安全需求操作系统的主要防护手段。业界对操作系统强制访
随着集成电路制造工艺向超深亚微米和纳米级推进,芯片集成度大幅提高,嵌入式随机访问存储器(RAM)逐渐成为集成电路芯片的主体。由于高密度嵌入式RAM的成品率直接影响着芯片的成
随着社会、经济的发展,人们认识问题的复杂性、不确定性持续增加,这就导致表征事物行为特征的数据往往不是一些确切的数,而是一些带有一定误差的取值范围,我们称之为区间数,
随着机器人研究的深入和机器人领域的拓展,许多恶劣、危险环境下的作业,都需要由作机器人完成。这些作业一般都比较复杂,由于受机器人技术水平的限制,目前机器人很难自主完成这些
软件成本估算领域经过四十余年的发展,涌现出一大批估算理论与方法,但都没有在现实环境中的软件企业中得到广泛应用,在项目早期进行软件成本估算仍旧是一件非常难的任务。由于估
社会网络分析(Social Network Analysis,SNA)是使用量化方法对社会网络进行分析,研究其中个体和网络特性的学科。近年来,随着Internet的发展,大量社会网络数据的出现,尤其是由网络行
逆向工程以其在产品设计和研发中的独特优势,得到了广泛的研究和应用。作为其中的两项关键技术,点云数据简化和曲面重建具有重要研究价值。如何有效地缩减点云数据的规模并在
ICRH(Ion Cyclotron Resonance Heating)天馈线远程控制与状态检测系统是EAST-ICRH控制子系统之一。基于FPGA的天馈线远程控制与状态检测系统实现解决了新型ICRH天线和传输系
射频识别(RFID)是一种利用无线射频的远距离通信方式实现的非接触式的自动识别技术,和其它识别系统相比较具有速度快、实时性强、采集准确性高等优点。随着技术的发展,RFID系
语音识别技术具有重要的理论价值和广阔的应用前景,近年来受到了人们的广泛重视。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解