地铁日志数据描述及解析引擎的研究与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:cg120900230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,爆炸式增长的数据量为数据处理带来了新的挑战。在地铁系统中,每条线路包含数千个设备,设备在运行时会产生地铁日志数据,这些数据具有数据量大、数据类型多、消息格式多、变化多等特点。如何快速高效地解析地铁日志数据成为了运营地铁系统时需要解决的重要问题。地铁日志数据需要大量代码支持解析工作,而手工编写代码的方法已不能高效应对不断变化的多格式海量数据,成为存储和分析地铁日志数据等后续工作的瓶颈。针对上述问题,本文研究与设计了一套针对地铁日志数据的数据描述语言,在此基础上设计与开发了一个解析引擎,引擎通过对基于数据描述语言所编写的数据描述文件的解析,可自动化地生成用于解析和处理地铁日志数据的代码,并支持将生成的代码部署到实际应用环境中。本文首先介绍了数据描述语言的概念和数据解析技术,对比分析了几种自动化生成代码的方案;接着在需求分析章节,详细分析了地铁日志数据的特点和解析过程,提出数据描述与解析引擎的需求;在概要设计章节,将以数据描述文件为基础的解析引擎作为一个代码生成与部署系统进行了系统结构设计、模块化设计、架构设计和可视化界面设计,按照功能将系统划分为了代码生成模块、代码合并模块、代码应用支持模块和代码部署模块这四个功能模块;在系统详细设计与实现章节,首先介绍了针对地铁日志数据设计的数据描述语言,给出该语言词法、语法和语义的设计,通过举例展示了如何使用该语言描述地铁日志数据。接着借助流程图和核心代码对解析引擎各模块的设计与实现做了详细阐述;在测试章节对各模块功能实现和性能表现进行了测试和结果分析;最后,对本文的主要工作成果进行了总结,并对不足之处进行分析,对未来相关工作进行了展望。
其他文献
<正>~~
会议
针对风电等新能源大量接入吉林电网,因其发电的间歇性导致电压问题日益严重的现状,介绍了本地区无功电压管理的理念、机制措施及实用做法,分析了风电集中接入地区的无功电压
水力旋流器入口截面上不同位置的颗粒存在着不同的运动轨迹,不同的运动轨迹可以直接反映旋流器的分离性能,因此,弄清楚入口截面上的分离高效区非常重要。采用EDEM-FLUENT耦合
当前新型冠状病毒引发的肺炎疫情汹涌而来,让人猝不及防。面对充满风险和考验的疫情挑战,政府采购应积极投入到这场没有硝烟的战场,为支持打赢疫情阻击战和经济高质量发展提
报纸
急性髓性白血病(AML)是一种恶性克隆性疾病,占白血病患者总数的80%左右。目前,已发现多种用来治疗AML的酶类抑制剂,并取得了一定的成果。本文以AML为主要适应症,主要针对已经
经初步调查发现在连城林区羊肚菌分布11种,该菌多发生在5月初至6月中下旬,其采摘量与降雨量呈正比。
礼仪漫谈之四──工作着装审计机关工作人员,现有统一的工作装,但最好的工作服首选西装,但要选用适合自己年龄的西装。二十岁左右,刚参加工作,无论从哪个角度讲,都不宜穿名牌高档豪
期刊
基于新疆红枣矮化密植的模式下,红枣物料特性是设计红枣收获机械的理论基础。为探究灰枣和骏枣的抗挤压能力与力学性能等物料特性,首先采用排水法测定灰枣和骏枣的密度,然后
健身气功作为我国民族传统体育项目之一,是以自身形体活动、呼吸吐纳、心理调节相结合为主要运动形式的运动项目,其以中医学为理论基础,具有独特的养生价值,也是中华悠久文化
当前畜牧业散养农户数量急剧减少,形成畜产品产能缺口,影响畜产品的稳定供给,也为畜牧业规模经营发展提供了良好契机。畜牧业规模经营是现代畜牧业的标志,是畜牧业的发展方向。本