基于多维指标的故障定位系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lfszlfs2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于大规模在线服务系统来说,为了维持高质量的使用体验和服务质量,保障在线系统的稳定性极其重要,这也正是运维工程师存在的价值。大规模在线服务系统往往具有数据量巨大、指标多维度以及实时性要求高三个特性。对于大规模在线服务系统,仅凭运维工程师人工监视或者简单依照规则的自动化运维系统,很难全面且迅速地发现故障的产生并定位到导致故障的真正根因集合。因此,智能运维(Artificial Intelligence for IT Operations,AIOps)应运而生。AIOps 共包含两大课题:一是,迅速准确地检测到在线系统中存在的故障,即故障检测;二是,快速地定位到导致故障的真正根因集合,即根因定位。针对AIOps的上述两个课题,本文分别提出了相应的算法,并设计实现了一个基于多维指标的故障定位系统。本文提出基于改进门控循环单元的变分自动编码器模型的故障检测算法和基于解释力和潜在关联分数的蒙特卡洛树搜索模型的根因定位算法。在故障检测方面,利用门控循环单元可以发现时间序列相关性的特点,本文将改进的门控循环单元应用在变分自动编码器的框架下,使得传统变分自动编码器在进行时间序列检测时的局限性得到了有效解决。在根因定位方面,本文提出一种新的指标——潜在关联分数,并在蒙特卡洛树搜索开始前加入基于时间序列相关性和解释力的剪枝。本文利用这种新的指标在裁剪后的蒙特卡洛树中进行搜索从而找到导致故障的真正元素组合,最终实现对故障的根因定位。通过实验,本文分别证明了以上两种算法的有效性。基于以上两种算法,本文设计并实现了一个基于多维指标的故障定位系统。系统包含三个主要模块,分别为数据采集模块、故障检测模块以及根因定位模块,实现了从在线数据采集,到实时故障检测,再到快速根因定位的一个完整流程。通过功能测试和性能测试,本文证明了系统的三个子模块的高可用性。
其他文献
随着移动互联网和物联网各类新型业务和应用不断涌现,将带来数据流量的激增以及超过500亿量级的终端设备连接。超密集网络在室内外热点密集部署低功耗小基站,是解决5G移动网络数据流量爆炸式增长的有效方案。但由于通过基于有线光纤的回程连接密集部署,成本高昂,为了解决这个问题,第三代合作伙伴计划提出了接入回传一体化(IAB)体系结构。对于5G超密集网络,小小区的超密集部署与IAB节点的移动性会带来诸多待解决
数据时代之下,大数据技术渐渐成为数据时代的重要角色。大数据不仅是量的积累,更是质的飞跃。海量的、不同来源、不同形式、包含不同信息的数据可以容易地被整合、分析,原本孤立的数据变得互相联通。不过目前传统的数据产品在大数据场景下出现了一些局限性。如何针对大数据场景,如何处理不同的复杂数据源,这些都是目前横亘在用户和产品之间的鸿沟。如何才能让大数据变得亲切和易于理解,更好的服务用户,可视化无疑是最有效的途
全球互联网是由数万个内部结构各异的自治系统(Autonomous System,AS)构成,边界网关协议(Border Gateway Protocol,BGP)负责为这些自治系统传递并交换路由消息。BGP协议已经成为互联网重要的基础设施,保证BGP协议的安全对于维护网络空间安全具有重大的意义。但是,由于BGP协议在设计之初未考虑安全问题,导致BGP安全问题不断涌现。BGP前缀劫持是国内外研究人员
互联网中幂式增长的在线体验数据给传统的数据分析方法带来了巨大挑战,基于深度学习的情感分析算法有效节省资源的同时还帮助用户快速准确从大数据中获取其他用户意见倾向。视点级的情感分析任务突破了粗粒度的篇章级和句子级分析过于理想的假设条件的限制,使得分析过程更加类人。其分析结果包含一条意见文本中所有视点项的情感倾向,这也是其他级别缺失的。因此,多视点的情感分析任务可以最大化获取文本中的有效情感信息,是目前
现代社会飞速发展,对信息传输速度及传输容量也提出了更高的要求。全光网络以全光交换技术和密集波分复用技术为基础,顺应了当下大容量高速度通信传输系统的发展需求,受到越来越多研究者的重视。全光判决是全光交换中的重要环节,其应用范围主要集中在全光层的光交叉连接、路由选择、波长选择和自愈保护等方面。随着通信网络的快速发展,通信速度迅速提升,这就需要更快的全光判决速度。全光判决器采用光控光判决,具有高速、稳定
分布式光纤传感是一种利用光纤传输信息,可以在光纤沿线各个位置处进行分布式检测的传感技术。它具有耐高压、抗腐蚀、测量精度高等特点,目前被广泛应用于各种环境参量的检测。相干光时域反射计技术不仅能够对温度和应变进行测量,还能对扰动信号进行监测。但目前主流的分布式光纤传感器多数只能实现单一参量的监测,如果想要同时测量多个参量,则需要多个系统融合,成本非常高,因此多参量检测传感技术越来越被重视。针对上述的缺
实时人脸关键点检测技术在视频追踪、增强现实、人脸识别等领域具有广阔的应用前景,但是在实际应用部署中仍面临很多问题。基于APP的部署方式需要针对不同手机端系统进行适配,难以满足人脸关键点检测服务的跨平台需要,而Web+云计算的部署方式带来的网络延迟又难以满足人脸关键点检测的实时性需求。小程序作为5G时代边缘计算的重要平台之一,为人脸关键点检测技术提供了一种跨平台,普适化的部署解决方案。但是在小程序环
随着无线通信技术的发展以及无线通信在各种领域应用需求的快速增长,对于天线性能的需求也越来越复杂多样。各种通信方式并存的特点使得系统需要安装多种发射和接收天线,然而多天线的存在会导致系统空间的减少以及不同信号之间的互相干扰。同时外部环境也是在不断变化的,天线需要更好的与物体表面结合,因此可重构和柔性是未来天线发展的重要方向。相较于传统的固态材料,液态金属的性质使得其非常适合应用于可重构和柔性天线上的
目前,生物识别技术在人们日常生活中已经有着广泛的应用,如解锁与支付等,具体技术有指纹识别与人脸识别等。但是这两种生物识别技术存在着明显的弊端,只能在近距离或者触摸的情况下进行生物身份的识别。当人处在远距离且无法触摸的情况下,这两种技术将无法使用,步态识别可以完美的解决以上弊端。以往的步态识别研究工作主要是基于图像识别的,图像识别的弊端是只能在光线良好并且无遮挡的情况下才能使用。随着5G技术的不断发
随着信息化社会的迅速发展和“互联网+”思维的广泛传播,政务部门也越来越依托于信息通信以及互联网平台开展“互联网+政务服务”,政府部门开展政务服务的行为也逐渐转移到网上,因此传统的监督方式和效能监察已经无法对互联网上的政务服务行为进行有效的监管,其问题主要表现为难以量化各项监管指标、难以实时监控各项指标、难以对监管结果有效溯源、难以高效地进行监管等方面。为了解决以上问题,本论文通过设计和实现中国河南