论文部分内容阅读
近年来,匿名通信技术飞速发展,该技术通常利用内容加密、多跳转发、流量混淆等手段实现通信数据和通信关系的匿名化,使得匿名通信实体难以被关联和溯源。同时,借助匿名通信技术部署的隐藏服务,必须通过特殊的软件和配置才能访问,而大量隐藏服务形成了暗网。由于暗网中充斥着大量非法活动,包括毒品交易、军火买卖、色情信息、黑客攻击等,已严重影响和危害网络空间安全和人们日常生活,因此亟需通过技术手段来加强暗网的监管和治理,其中对匿名通信网络的识别与发现尤为重要。针对当前主流的匿名通信网络I2P,如何设计综合应用多种途径、具有较好健壮性的匿名节点和隐藏服务大规模发现方法,如何利用协议特征快速识别I2P流量,如何针对隐藏服务设计定位追踪方法,都是在I2P监管领域亟待解决的关键技术问题。针对上述问题,本论文的研究工作包括以下四个方面:首先,根据I2P的拓扑特点,设计并实现一种综合主动补种、节点感知、节点查询三种方式的I2P拓扑发现方法,实验过程中发现的节点数量达10万以上,验证拓扑发现方法的有效性;其次,针对I2P中有载荷的TCP流量,分析流量的报文长度序列特征和报文长度分布特征,并建立机器学习的分类模型,其识别率大于98%,能够有效识别I2P中的TCP流量;然后,依据I2P隐藏服务的域名和管理机制,设计并实现一种综合官方信息获取、搜索引擎信息获取、节点感知、链接扩展等方式的I2P隐藏服务发现方法,并在较长时间的实验中获得约一千万条暗网链接和大于150 GB的隐藏服务数据信息。设计基于流水印的隐藏服务定位方法,并验证多种频率水印信号的有效性;最后,整合I2P网络拓扑发现、I2P网络流量识别、I2P隐藏服务发现和定位的研究成果,设计并实现I2P匿名通信网络的识别与发现原型系统,并对系统功能进行测试与验证。综上所述,本论文分别研究I2P的网络拓扑发现方法、I2P网络流量识别方法和I2P隐藏服务发现和定位方法,并在此基础上实现I2P匿名通信网络的识别与发现原型系统,可为I2P匿名网络监管提供重要的技术支撑。