基于特征选择的托攻击检测研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:jugc007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐作为一种重要的个性化服务,越来越广泛的应用于电子商务领域,为用户获取推荐信息和商家营销提供了极大的便利。然而托攻击的出现,严重降低了推荐系统的准确性和可用性,一定程度上制约了电子商务的发展。为此,托攻击检测的研究受到了广泛关注,本文在国内外专家研究基础之上,就基于特征选择的托攻击检测方法展开研究。由于托攻击的检测具有时效性,故随着时间推移,有必要重复检测。但初次检测和后续重复检测对算法的要求不同,初次检测要求算法结果尽可能准确,后续重复检测则要求算法具有较高的时间效率。因此,本文分别针对这两种不同需求展开托攻击检测算法的研究,并且将检测算法分解成两个子问题:有效的特征指标选择和基于特征指标集的检测算法。首先,考虑到传统托攻击检测算法不能灵活应对多种托攻击类型的情况,提出了一种基于信息熵动态选取检测指标的特征选择算法。结合信息熵的特性,将正常用户和攻击用户的划分看作两类随机事件,计算特征指标的信息熵,并以此判断其分类能力,完成特征选择。接着,设计了一种基于离群度的无监督检测算法,从特征值向量离群度的角度来识别攻击用户。分别在Movie Lens数据集上构造不同模型的托攻击,以此验证算法的正确性,再与其他几种主流的检测算法进行对比试验,验证算法的性能。然后,针对后续检测的高时间效率需求,在初次检测得到真实用户概貌集的基础上,提出一套基于项目流行度的托攻击特征提取方法。因为流行度是基于对项目评分数量的统计,所以在计算的复杂度上有较大的降低,再以真实用户与攻击用户在对评分项目的选择上存在差异为切入点,得出用户平均项目流行度和用户项目流行度信息熵两个特征指标,与上面的检测算法结合来完成后续的托攻击重复检测。最后,根据以上算法设计实现一个托攻击检测的仿真系统,通过模拟实际中托攻击检测的整个过程来验证本文所提出检测方法的正确性。
其他文献
近年来,计算机软件的应用已经渗入到了国防、航天、交通和医疗等各个关键领域,因此提高软件的质量已成为一项十分紧迫的任务。软件测试是保证软件质量的一种重要手段。相比于
随着计算机和互联网技术的不断发展,网络应用越来越广泛。网络安全的重要性日益凸显,已成为各个安全组织、机构的研究热点。而攻击重演平台是将网络攻击方法、攻击工具、攻击决
IPv6(Internet Protocol Version 6,IPv6协议)和IPv4一样是工作在网络层的协议,它是TCP/IP协议的重要组成部分。IPv6协议吸收了IPv4的优点并弥补了其不足,它具有地址空间巨大
随着移动通信和电子技术的发展,移动对象管理变得越来越重要,已经成为了近年来研究领域中的热点问题,具有重要的理论和现实意义。移动对象的特点是位置持续变化,索引中的索引
伴随着信息化技术不断地发展,科学文献以电子档的形式出现的需求越来越多,如何实现科学文献的电子化得到更加广泛的关注和深入的研究。数学公式是许多科学文献的重要组成部分
随着数字技术的发展,数字媒体逐渐的在越来越多的商业领域和科学领域发挥重要的作用,如三维场景再现、游戏产业及空间科学模拟等。这些大部分的实现工作都是在本地机器上,或
随着手机的普及,移动服务在中国逐渐拥有广阔的市场前景。移动技术的不断发展,以及人们意识的转变,移动应用已经不再只是一种时尚。相对于互联网应用,在面对大量的信息时,在
数据发布为数据共享和数据交换提供了便利。然而,随着数据发布技术的不断发展及其在人们工作和生活中越来越深入的应用,数据发布过程中的隐私泄漏问题也日益突出,如何避免隐私数
网络安全是动态的、整体的,而传统的安全防护模型是静态的、孤立的和被动的。防火墙、入侵检测等各种安全检测手段都有各自的缺陷,并且在防御网络入侵方面没有形成联动,这些
近年来,并发系统有着颇为广泛的应用。事件结构作为并发系统的语义模型之一,引起了理论与工程学界极大的关注和兴趣,并吸引了大量的学者进行研究。传统的事件结构建立在抽象