基于内存计算的流数据处理在飞行大数据的研究与应用

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:fayeming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大飞机进行试飞测试,能够产生海量的试飞数据。传统的数据离线处理方式效率低下,延迟了试飞周期,增加试飞成本。为了能够高效的分析处理这些数据,本文设计并实现了一个基于内存计算的流数据处理的试飞数据处理系统。本文中的试飞数据处理系统,采用数据实时处理方式,依靠内存计算和流计算的高效性,显著提升数据处理效率。此外,本文提出了一种基于Markov的内存预测动态分配方法和一种基于时序排队的流数据处理方法,结合Spark分布式内存计算框架,随机过程和排队论等相关知识,改进了原有内存计算和流计算的处理方式,可以加快海量试飞大数据的处理和流转速度,提高数据的价值。本文提出了一种基于Markov的内存预测动态分配方法,通过采用多马尔科夫链方式,根据其状态转移概率,求得其最大概率的转换情形,预测出最有可能需求的内存大小,能够节省内存分配的查询时间,降低内存碎片率。本文同时提出了一种基于时序排队的流数据处理方法,通过对带时间戳的流数据按照时序进行排队,从而能够按照试飞数据的处理要求进行按序处理,同时提升流数据的处理效率。本文设计并实现了的一个基于内存计算的流数据处理的试飞数据处理系统,主要包括了数据采集子系统、数据预处理子系统、数据分析子系统、综合管理子系统等四个主要子系统。数据采集子系统主要负责进行机载原始数据的采集工作,并结合时间戳,形成时序原始数据;数据预处理子系统主要负责将原始数据进行格式转换,通过帧格式转换、工程量转换和流数据转换,最终形成所需的流数据;数据分析子系统主要负责进行数据整理和数值运算,可以结合各种算法,完成数据训练和数据的计算,最后得到试飞结果;综合管理子系统主要包括系统二次开发、系统管理和数据管理三方面,能够对系统和数据进行有效的综合管理使用,以及二次开发。本文通过试飞数据处理系统和Spark分布式内存计算框架结合,充分利用Spark对于海量计算的优势,并采用基于Markov的内存预测动态分配方法来提升Spark内存计算时内存分配的效率,采用基于时序排队的流数据处理方法来提升Spark Streaming处理时序流数据时的效率,从而能够加快数据的实时处理速度。
其他文献
目的:探究微小RNA(micro RNA,MiR)-141在膀胱癌组织中的表达及与肿瘤分级的相关性。方法:选取2012年3月-2014年3月于南通大学附属医院确诊的80例膀胱癌患者的癌组织及癌旁正
目的:观察重度创伤性脑损伤(traumatic brain injury,TBI)患者预后的重要影响因素。方法:回顾性分析2012年1月1日-2018年12月31日于南通大学附属医院康复医学科住院的81例重
目的:探讨局部应用神经生长因子-壳聚糖纳米颗粒缓释凝胶对1型糖尿病大鼠烫伤创面中血管内皮细胞生长因子(vascular endothelial growth factor, VEGF)、低氧诱导因子-1α(hy
<正>我国现行的征地制度在提高建设用地供给速度、发挥规模经济效益、促进城市规划有效实施、加快城市建设等方面具有不可比拟的优势,但在公平、权利和财富分配等方面亟待改
介绍一种用氧浓度仪检测的方法来检测氧气管道泄漏.这种全新的医院集中供氧管道检查检测方法,它具有操作简单、体积小、不受区域和部位的限制,可非常准确的对氧气泄漏进行检
采用传递函数法导出含有渐变空腔的吸声覆盖层的声压插入损失,利用吸声覆盖层结构的声学特性,对吸声覆盖层的吸声系数进行计算。分析计算结果,探讨吸声覆盖层的不同结构参数
"中概股"面临的集体退市压力暴露出中国上市公司治理的深层次问题.本文以分众传媒为研究对象,从公司治理角度剖析了其退市的风险及成因,旨在为在市以及拟海外上市的企业提供有
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技