深度包检测系统中基于正则表达式多模式匹配算法

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:gyk0088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,深度包检测系统成为了网络中越来越重要的组件。当前,由于深度包检测系统的核心算法的设计缺陷,实际的深度包检测系统往往无法提供线速处理的能力,同时,网络环境的不断复杂化也使深度包检测系统面临着前所未有的挑战。现代深度包检测系统大多数都采用正则表达式来定义模式,但传统上利用有穷状态自动机(FA)实现正则表达式可能导致匹配算法的时间复杂度很高或者需要大规模的存储空间。这些因素导致基于正则表达式的深度包检测系统效率低下。本文基于正则表达式的深度包检测系统,设计和实现了基于正则表达式多模式匹配算法来解决上面的问题,包含的主要内容有:   在正则表达式的存储优化方面:   ●分析了造成DFA状态数膨胀的正则表达式的类型,提出一种量化DFA状态数膨胀的参数一正则表达式的膨胀率DR(Distent Rate),并将这个参数应用到之后的算法中。   ●提出了一种正则表达式分片的算法(RECCADR),将正则表达式分成了头部、中部、尾部三个部分,其中头部和尾部是造成正则表达式的DFA状态数膨胀较轻的部分,中部是膨胀严重的部分。通过正则表达式合理分片,可以显著降低DFA的状态数,从而降低DFA的存储空间。   ●提出了一种正则表达式集合的分群算法(REGADR),基于正则表达式的膨胀率DR(Distent Rate)将正则表达式集合有选择的分成DFA状态数相近的群,降低了正则表达式匹配算法的空间复杂性。   基于上面对正则表达式存储优化方面取得的进展,设计了在高速网络条件下在深度包检测系统的一种新型的多模式匹配算法-TSREMA,具体包括:   ●设计了TSREMA算法的存储结构:平行根两级结构的存储模型,通过合理分布模式集合,可以在保持匹配算法性能下降不大的情况下,有效地降低了模式集合的存储消耗。   ●设计了TSREMA算法的匹配策略:在存储结构的基础上,设计了包含快速处理通道和慢速处理通道的区分服务匹配策略,保证了正常数据包的快速通过和恶意数据包的全面检测,适合深度包检测系统在网络环境下提供线速处理服务。
其他文献
个性化场所语义识别是将家、学校等个性化场所语义赋予某个具体地理位置的过程[1],对提供更加智能的基于位置服务有着重要意义。然而,现有的个性化场所语义识别方法往往陷入对
大规模数据集的访问和计算使得OLAP查询往往需要付出高昂的时间代价。本文主要研究信息网格环境中分布式OLAP查询处理面临的两个重要问题:   (1)如何有效利用数据源计算能
当前互联网存在诸多弊端,需要通过革新来适应不断变化的需求。由钱华林研究员提出的层次式交换网络是一种全新的网络理论,从体系结构的高度解决了现有互联网的许多问题。层次式
多核处理器(Chip Multi-Processor,简称CMP)逐渐成为微处理器的主流。高效的片上数据传输系统对多核处理器设计至关重要,并且随着半导体生产工艺的不断进步成为阻碍处理器性能
VoIP第三方交换中心旨在为VoIP运营商提供一个第三方的独立的交换平台,方便VoIP运营商之间进行互联互通,同时,也为国家规范VoIP市场,对VoIP进行有效的监管提供一个可行的解决方案
结构化信息标准推进组织(0rganization for the Advancement of Structured Information Standards,0ASIS)制定的安全性断言标记语言(Security Assertion Markup Language,SAML
随着计算机图形学和虚拟现实技术的不断发展,大规模虚拟场景的实时交互绘制技术在模拟仿真以及三维交互设计等方面表现出日益广泛的应用,成为诸多研究领域面临的基本问题。近年
基于Linux远程桌面系统的音频应用,不仅是教育、电子政务、军事等领域的基本要求,同时也是满足个人Linux桌面运行环境的要求,它与Linux本地桌面系统音频应用有着巨大的差别。在L
随着化学计算和计算机技术发展,越来越多的软件被开发出来应用于化学计算、分子可视化、分子建模及化学数据库检索等领域,如何有效整合不同的化学软件为用户提供一个既可用于
本文从移动终端的安全问题出发,研究如何通过移动终端安全芯片提高终端系统的安全性,并将文中提出的新思想和国内外先进的研究成果结合起来,实现了完整的移动终端安全芯片解决方