基于DBN的网络流量分类的研究

来源 :内蒙古大学 | 被引量 : 19次 | 上传用户:sunningyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有模型对P2P流量分类准确率较低的问题,本文提出一种基于深度学习结构、半监督的深度置信网络(Deep Belief Networks, DBN)的流量分类方法,构造P2P流量合适的特征空间,建立基于DBN的网络流量分类模型,并对模型的隐含节点个数和隐含层个数进行选择,进而提高DBN模型对P2P流量的分类准确率。本文使用基于进程的方式构造了P2P流量私有数据集,并将此数据集和剑桥大学Moore实验室、LiWei等人提供的公共数据集作为本文的实验数据集,分别使用BP方法和DBN方法进行建模、测试并对实验结果进行分析。得出BP神经网络的隐含层个数为1-2层时P2P应用的分类准确率最高,而DBN方法的隐含层个数在3~4层时分类准确率最高。对于公共数据集,DBN方法对P2P应用的F-measure值高于BP方法23.3%;对于私有数据集,DBN方法对iQiyiPPS、 Sohu、PPTV和Baofeng的平均F-measure值高于BP方法13.2%。
其他文献
目前突发公共事件及各类自然灾害频繁发生,对突发事件进行分析、预防和应急响应的城市应急联动系统应运而生。然而构建城市应急联动系统所需的数据资源大多处在孤立分散的状
随着计算机网络技术的发展和我国信息化进程的不断推进,计算机网络在人们的日常工作中发挥着越来越重要的作用。目前,大部分的企业或机关单位都组建了内部的局域网,实现了资源共
随着SOA应用的不断深入,大规模服务管理及Web服务自动化处理的重要性不断增加,而当前SOA体系的基础设施已经难以满足这些新的需求,构建新的SOA体系的基础设施已经成为越来越
随着计算机技术的迅速发展,计算机游戏逐渐成为人们最重要的娱乐方式之一和IT行业中最重要的利润增长点。如何在计算机游戏中模拟人类智能,增加游戏的娱乐性和互动性,已经开始受
分类是数据挖掘的一个重要课题。随着数据规模与维数的增加,建立高效的、适用于大型数据集的分类算法已成为数据挖掘的一项挑战性任务。基于显现模式(Emerging Patterns,EP)
在以Gnutella和KaZaA为代表的无结构P2P文件共享系统中,由于文件的流行度呈现不均衡分布,使得现在通常采用的洪泛查询机制的效率较低。已有的针对文件流行度判定机制的研究着重
手语是聋人进行交流的主要方式,是一种通过双手的手形和运动来表达信息的形式化语言。手语识别研究不仅可以增进聋人与健听人之间的无障碍交流,还可以提高计算机对人体语言的理
随着网络在蒙古地区的迅速普及,互联网已经成为蒙古族人民信息传递的主要媒介。然而,网络信息聚集,导致信息严重过载。因此,如何从成千上万的蒙古文网站中获取有价值的内容,
The modeling business processes still remains the responsibility of ITpersonnel. This has produced a gap between business process modelingtechnology and busi
随着网络技术的飞速发展,我们的生活,学习,工作和娱乐与网络联系得越来越紧密。我们充分享受网络带给我们的方便的同时,各种各样的病毒,木马等恶意软件也在网络上大肆流行。这些恶