两种高性能多模式匹配算法的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shao402248950
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机研究领域的核心技术之一,模式匹配算法被广泛应用于网络安全,搜索引擎以及生物计算等领域,特别是针对网络安全问题,模式匹配算法的性能更是直接影响了网络安全系统的整体性能。随着计算机网络技术的飞速发展,互联网产生的数据量也呈爆炸式增长,从而导致了模式匹配算法的研究面临着诸多新的挑战,其中主要表现为随着模式集的规模迅速增大,模式匹配算法的性能成为系统的瓶颈所在。因此绝大多数经典的模式匹配算法无法直接有效的运用到大规模模式集环境下,所以研究适用于大规模模式集环境下具有高匹配性能的模式匹配算法是当务之急,具有重要的学术研究意义和广阔的应用前景。论文的主要工作如下:1.提出了一种高匹配性能的较大规模多模式匹配算法,简称为ELSM算法。论文首先分析了一种适用于较大规模模式集而且空间复杂度低的多模式匹配算法:MASM算法,以及MASM算法在预处理阶段用于模式串压缩的Leaf-Attaching算法。虽然MASM算法空间复杂度低,但是算法的时间复杂度高,而且算法的时间复杂度和模式集的数量成正比。本论文提出的ELSM算法在保持MASM算法低空间复杂度性质下又有着较低时间复杂度。ELSM算法在预处理阶段使用改进的Leaf-Attaching算法,保证了算法在压缩大规模模式集的时候不会出现内存不足的情况。ELSM算法在模式匹配阶段对MASM算法提出了如下三种改进策略:(1)使用数组的形式来实现完全二叉搜索树,减少了算法的内存占有量并且加快了访问树节点的速度。(2)采用AC算法作为初步匹配算法,过滤掉文本串中大量不会发生模式匹配的位置,减少了算法的匹配时间。(3)使用哈希表将完全二叉搜索树分组,该策略减少了算法需要遍历的完全二叉搜索树的高度,从而减少了算法的匹配时间。最后通过实验验证ELSM算法在保留了MASM算法具有较低空间复杂度优点的基础上,有着更高的匹配性能。2.提出了一种带失效跳转机制的多模式匹配算法,简称为SBT算法。SBT算法主要基于Burst Tries数据结构实现,论文首先详细分析Burst Tries的数据结构,以及Burst Tries的字符串查找以及字符串插入过程。然后提出将Burst Tries数据结构应用于多模式匹配领域的方法,并针对在应用过程中会出现的空间复杂度过高和匹配效率低下的缺点提出了两种改进策略即空间压缩与失效跳转策略,其具体内容为:(1)SBT算法通过空间压缩策略降低了Burst Tries中节点的内存占用量,从而降低了算法的空间复杂度。(2)SBT算法的失效跳转策略充分利用了模式匹配过程中已经匹配的字符串信息,保证算法能跳过文本串中大量不会发生匹配的位置,从而提高了算法的匹配效率。最后通过设计一系列实验验证了SBT算法在匹配性能上的优越性。
其他文献
高分辨率合成孔径雷达(Synthetic Aperture Radar,SAR)自诞生以来便受到相关研究人员的关注,SAR分别使用脉冲压缩技术和合成孔径原理提高了距离分辨率及方位分辨率,进而实现
软件已经成为国防建设与国计民生的重要组成部分,如何提高软件的正确性、可靠性和安全性是计算机软件领域面临的重要挑战。Clarke等人提出的模型检测方法被认为是迄今为止应
隐私保护是数据挖掘领域中一个重要的研究方向,其目的是如何在不泄露私有数据的前提下,使用数据挖掘工具得到精确的挖掘结果。为了有效地保护分布式环境下的隐私,研究人员已
对于Web应用系统,创建有效的测试用例是非常困难的。为了全面测试一个Web应用系统的功能,测试用例必须能够测试复杂的应用系统状态以及并发的用户交互。目前,应用于Web应用系
年龄作为人类的一种重要身份信息,在安全监控、人机交互、视频检索等方面有很大的应用潜力。随着近年来生物特征识别技术的兴起,基于静态人脸图像的年龄估计技术已经成为计算
信道极化理论的提出表明在任意二进制输入离散无记忆信道下都可以构造能够达到容量限的码字序列。根据这个理论,Arikan给出了Polar码的构造方法,并证明了它具有较低的编译码
在高速通信网络的发展过程中,业务流呈现出的突发性和多样性为提高网络服务质量制造了更多的困难,由此引发的网络拥塞已成为制约网络发展的瓶颈。不断发展的主动队列管理AQM
虚拟企业模式的优势得到了学术界的认可与大力推崇,被认为是21世纪主要的制造模式。虚拟企业基于成员企业核心竞争力优势互补而形成具有敏捷制造能力与以小搏大效力的联盟模
随着市场竞争的日益激烈,企业上层生产计划管理受市场影响越来越大,对时间的敏感性要求愈来愈高。面对客户对交货期的苛刻要求,面对更多产品的改型,订单的不断调整,企业的计
虚拟企业是为了适应快速反映而提出的一种先进制造生成组织方式。虚拟企业的制造资源调度分配过程是虚拟企业运营过程中的重要环节,调度效率的提高将在很大程度上改善整个虚拟