恶意域名挖掘分析技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yongheng0106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,来自网络安全方面的威胁也层见叠出。域名系统作为完全开放的服务系统,对域名的无条件信任机制使其已成为网络恶意行为的关键组成部分。在经济利益的驱使下,攻击者使用恶意域名促进了僵尸网络和钓鱼网站的发展,导致受害者信息和设备数据泄露严重、DDos攻击泛滥以及病毒快速扩散等问题。为了逃避域名检测,不法者利用域名生成算法(Domain Generation Algorithm,DGA)生成海量域名以实现域名速变。因此,针对恶意域名的准确检测已经成为当前网络安全研究领域的热点之一,本文主要针对恶意域名挖掘技术展开研究,在分析对比现有研究的基础上,分别提出针对速变域名和误植域名的检测方法,从这两个方向实现对恶意域名的检测。首先,针对域名生成算法生成的域名具有一定迁移性和跳变性的特点,本文提出一种白名单与分类算法相结合的检测方法。该方法使用白名单对良性域名进行有效过滤,减轻后续分类的压力。从词汇特性和网络属性两方面提取特征,在域名词汇特性方面主要利用香农熵量化随机性、马尔科夫与N-gram量化域名的可发音性和差异性,在网络属性方面提取基于TTL、IP和WHOIS特性的特征,对两组特征处理后采用分类算法进行训练和分类。通过使用公开的域名数据集,对比分析XGBoost、SVM、朴素贝叶斯算法的分类效果,证明XGBoost能够提高域名检测的准确率。其次,针对误植域名与良性域名在字符上极为相似的特点,本文提出一种黑白名单与聚类方法相结合的检测方法,结合误植域名的特性,该方法采用Jaccard距离和共同字符个数占域名长度比例的加权调和平均值来量化相似度,使用基于密度聚类的DBSCAN算法将良性域名进行聚类,检测时采用黑白名单准确检测出尚在生命周期内的误植域名和良性域名,未成功过滤的域名,聚类分组后与组内域名计算编辑距离,若编辑距离小于设置阈值则判定为误植域名。通过使用公开的域名数据集,对比线性计算编辑距离方法以及不同阈值下的检测效果,证明所提方法在准确率相似的情况下能够提高误植域名检测的速度。
其他文献
华北地台的热液金矿床经常产于绿岩带中的花岗岩内外接触带和变质岩中,因而许多人认为花岗岩和地层就是金矿床的矿源层和矿源岩。显然,他们的假设是建筑在这些岩石金的含量高于
建立了一个考虑森林砍伐和竹子开花影响的"林木、主食竹和大熊猫"三位一体的非线性动力学模型,利用Mawhin重合度定理证明了在一定的条件下模型存在一个周期解,获得了一个大熊猫
喜剧电影是当下高票房国产电影中的支柱性力量。中国观众对于喜剧片拥有超乎想象的情结和追捧,这样的热潮体现了中国观众特殊的审美情趣,同时还展现了对现实生活中压力和郁闷
2015年9月10日消息,以解决上班族出行、主打班车预订服务为定位的考拉班车将在9月11日完成最后一天班车运营。自此之后考拉班车公司将终止服务。从3月11日成立算起至9月11日
2 0 1 5年9月3 0日,中国I M T-2020(5G)推进组宣布,已与欧盟5G基础设施协会(5G PPP)签订5G合作备忘录,双方将在5G推进中展开合作。此后,双方将携手在5G通信系统和网络的愿景及需
介绍了甘蔗收获机械可视化虚拟集成设计平台研究开发的基本思路 .该平台的构建通过 STEP标准建立产品开发的全局共享信息模型 ,利用 PDM软件集成和封装 CAD/ CAE及其它产品设计过程中用到的应用软件 ;平台也集成了甘蔗收获机械设计、分析和评价专家系统 ,专家系统采用模糊评价的方法对开发过程设计和仿真分析的结果进行评价和决策 .集成平台支持甘蔗收获机械可视化虚拟产品集成化的团队设计及收获机械系
三维电生理标测系统(简称三维系统)作为射频消融术的辅助治疗工具正在被逐渐认可。研究表明,术中引入三维系统可以有效地减少X线的曝光时间,降低对术者的危害。现有的国外三