【摘 要】
:
时间序列数据在日常生活里随处可见,利用以机器学习为代表的人工智能技术从中挖掘有效信息有着广泛的应用前景,成为了学术界和产业界的热点话题。然而,现实场景中各类不可避免的因素导致时间序列数据存在缺失现象,严重影响了时序数据挖掘的准确性和效率。为有效解决该问题,时间序列缺失数据补全算法的研究引发了学术界与工业界越来越多的关注。在时间序列数据缺失中,整段缺失——一段时间内序列中所有维度的数据全部丢失,是其
论文部分内容阅读
时间序列数据在日常生活里随处可见,利用以机器学习为代表的人工智能技术从中挖掘有效信息有着广泛的应用前景,成为了学术界和产业界的热点话题。然而,现实场景中各类不可避免的因素导致时间序列数据存在缺失现象,严重影响了时序数据挖掘的准确性和效率。为有效解决该问题,时间序列缺失数据补全算法的研究引发了学术界与工业界越来越多的关注。在时间序列数据缺失中,整段缺失——一段时间内序列中所有维度的数据全部丢失,是其中一类常见且富有挑战性的情形。数据整段缺失意味着补全过程中将没有任何维度的数据可供参考,使得现有的很多依赖于时间序列各维度数据空间关联关系完成数据补全的算法在此情形下不可行,无疑大大增加了数据补全的难度。针对上述情形,结合本文对真实数据集的观察,本文认为在度量某被观测对象时形成的时间序列数据,不仅体现了被观测对象自身的演化规律,同时也体现了外部事件对该对象带来的影响。因此,我们可以在补全缺失数据时将外部事件以标签形式进行符号化,合理运用这部分信息增强数据补全效果。基于以上思想,本文提出了一种新颖的时间序列建模方法,并在该建模基础上提出了面向带标签时间序列缺失数据的补全算法HKMF-T,更进一步地,本文将包含HKMF-T在内的一系列算法进行封装并实现了一个基于时间序列数据库InfluxDB的数据补全工具。总结来说,本文贡献主要包括以下几点:●本文提出了一种外部标签信息增强的时间序列数据建模方法,该模型综合了时间序列数据内部变化特性(即,演化趋势)和标签指示的外部影响特性(即,外部影响),并为相应特征制定了符合物理观察的约束条件,为后期补全奠定了理论基础;●本文基于上述模型,提出了一个Hankel矩阵分解数据补全算法HKMF-T,算法利用时间序列中的已有观测值及标签信息共同学习演化趋势、外部影响两部分的值,从而完成对缺失数据的估计。并且,本文在多个真实数据集上进行了实验验证,实验结果表明HKMF-T算法取得了较其他对比算法而言更高的补全准确性;●本文对包含HKMF-T在内的一系列时间序列缺失数据补全算法进行了封装,设计并实现了一个基于时间序列数据库InfluxDB的缺失数据补全工具,工具在带标签时间序列数据上展现出了较好的数据补全效果,具有较好的实用性。
其他文献
永磁同步电机具有高功率密度、高可靠性、过载能力强等特点,在很多的工程领域得到了广泛的研究与应用。由于直接转矩控制具有响应迅速与动态性能良好等优良特点,目前已得到了很好的发展。但是传统的直接转矩控制技术仍存在着一些不足之处,例如:电机参数受外界影响会出现非线性变化、转矩观测不精确以及转矩脉动较大等问题,从而会影响系统整体的控制效率。本文主要在转矩观测器方面,针对永磁同步电机存在的算法复杂、电机参数辨
金融危机后,全球金融业开始进行全面的改革,国际国内监管进一步收紧,中国银保监会、人民银行等监管机构加紧制定了一系列监管规定,开始了前所未有的严监管时代,银行业竞争也更加激烈。面临着严峻的挑战,加强内部控制,严格执行监管规章,依法合规经营是近几年银行业的主题。但是银行业金融机构仍然无法有效控制违规违法行为,案件和风险事件屡屡发生,每年都有数家银行及其分支机构被监管机构处以巨额罚款。因此,一个健全的内
标准必要专利包含了专利权的专有性和技术标准普适性两种属性,专利权是一种在一定范围以及期限内能够排他性使用的权利,而标准则是标准制定参与者在协商一致后达成的该领域技术共同确认的技术规范。在技术标准实施过程中纳入专利权,使得专利权本身所保护的“公域”与“私域”间的利益平衡被突破,专利权因此进入到了标准技术发明人的共有领域。拥有标准技术发明人之间的专利权如何保护成为法律需要特别对待的问题。考虑到标准专利
大气气溶胶的变化影响着整个人类的生活,对于大气气溶胶的测度主要以大空间尺度上遥感手段的气溶胶光学厚度AOD(Aerosol Optical Depth)或AOT(Aerosol Optical Thickness)监测为主。随着监测范围的扩大,对于大气气溶胶空间模式的分析越发重要。空间模式一般用于指代有几何含义的对象或排列分布格局,在地理学中,空间模式是地理对象的抽象,是地理对象在分析空间中的像,
在我国,农业生产所产生的玉米秸秆资源非常丰富,处理不当会造成资源浪费,或造成环境污染,其中饲料化利用是一种重要的应用方式之一。物理处理包括粉碎、蒸煮、热喷、辐射及高温蒸汽法等;化学处理的方法有很多,例如碱化、氧化、酸化和氨化等。微生物处理法,目前常使用青贮、微贮、酶解法等处理。本试验通过研究产阮假丝酵母不同发酵条件对氨化玉米秸秆粗蛋白质含量的影响,利用响应面优化发酵条件,探索出产阮假丝酵母菌的最适
随着全球科技与经济的快速发展,能源消耗日渐加剧。能源稀缺成了当前全世界的首要难题。我国作为世界上最大的发展中国家,伴随着国民经济的快速发展,已经成为世界上第二大能源消耗国,对能源的需求不断增加。这种现象导致了能源供需的失衡,形成了环境保护与经济发展的矛盾。因此,节能是目前各个领域发展时需要摆在前列的考虑因素。电网是电力输送的主要载体,不管是在发电方面,还是输配电上,都要尽力做到节能降损。我国的电网
自古以来人们一直都没有放弃对海洋资源的开发与利用。通信技术的崛起让整个时代再次焕然一新。水下光通信是将两者结合起来的近些年才逐渐兴起的新型通信方式。海水对不同波
随着我国社会经济的发展,人们的生活水平逐渐提高,农产品质量安全越来越受到重视。就水果而言,消费者现如今很重视水果的原生态、绿色和无公害。所以消费者希望了解在水果的种植、加工、运输和销售等各个环节的信息。条码和溯源技术的发展为品牌水果溯源提供了技术基础。同时,对于将来想从事品牌水果种植、加工和销售的企业,也将会面临这些问题。鉴于此,本文开发出适合这类企业的品牌水果溯源系统。本文的主要工作有:(1)根
在国家“十三五”规划中指出,需要推进现代服务业发展,提升该产业的发展速度,使其能够给国家经济做出更大贡献。由于产业集聚可以有效提升本地区产业和经济竞争力,而服务业也是衡量现代经济社会发达程度的重要标志,所以越来越多的地方政府提出建设现代服务业集聚区。可以说推进现代服务业集聚区发展必然跟政府职能履行密不可分,因而政府在现代服务业集聚区发展过程中发挥什么作用、实施什么政策、达到什么目的、政府职能在这个
苯丙氨酸氨基变位酶(PAM)是一类以MIO(4-亚甲基-咪唑-5-酮)为辅因子的酶,MIO是一种新型的内源性辅因子,是酶蛋白质在翻译后折叠过程中经两次脱水环化而成的具有强亲电性的基团。MIO介导底物α-苯丙氨酸的Cα位的氨基变位至Cβ位,生成β-苯丙氨酸,完成其异构化反应即区域选择性催化反应,同时也能催化中间产物反式肉桂酸的不饱和双键的Cβ位加氨合成β-苯丙氨酸。不同来源的苯丙氨酸变位酶的立体选择