Spark下分类模型研究及其在电网设备故障诊断中应用

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:caimingminggood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电网智能化建设进程中,电网状态监测系统庞大,监测数据的数量呈指数增长,数据处理问题变得困难。流处理平台Storm平台可以实现实时的处理数据,但是数据分类的模型需要提前进行训练,论文主要在Spark平台上对电力设备监测数据分类模型研究。论文提出了两种分类模型,第一种分类模型利用三比值法将连续的变压器数据变成离散的数据,用随机森林对这些离散的数据进行分析、训练;训练出来的分类模型再用标准测试数据集和变压器油中溶解气体数据集对其进行准确率测试。为了体现Spark平台相对其它平台的优势,又选用了Hadoop上的模型进行性能对比,均有优异的表现。第二种分类模型引入了互联网中使用比较多的Xgboost算法,并对算法的原理做了推导,根据算法的原理,引入到变压器故障分类中,作为分类模型进行训练,并分别用标准数据集和变压器油中溶解气体数据集对分类模型的分类结果准确率进行了测试。同时提出了在Spark和Storm之间模型应用PMML进行数据传输的方法。论文提出了三比值和随机森林相结合的并行变压器故障分类模型,和三比值化后运用Xgboost故障分类模型,对Storm电力设备数据流处理平台分类模型的选择具有重要的意义。
其他文献
通常情况下尾盘拉升是指个股在即将收盘时,股价出现大单快速拉升突然上涨的盘面。尾盘是股市一天即将结束的时间段,尾盘也是当日多空双方交易最终得出结果的时候。当天的收盘结果一定程度上,对一下交易日的开盘和盘中表现产生较大的影响。主力拉升吸筹、震仓、洗盘、出货都可以在尾盘展开。尾盘临收市是主力投机取巧操纵股价的常见时段,此时段做盘比较容易得手。  “尾盘”交易时段大致可从下午14:15分起。本文要讨论的尾
据研究,日本拥有30万之多的姓氏,而一般平民拥有自己的姓只不过130年的时间。日本人的姓氏字数不等,发音书写复杂,甚至还出现了诸如“一”、“小鸟游”这样的珍稀姓氏。可以说作
主要介绍以斑点状绿泥板岩矿石为原料,经破碎、筛分,烧胀成普通页岩陶粒、超轻页岩陶粒、大颗粒破碎页岩陶粒、陶砂等多种产品,及其混凝土制品的检测结果和开发利用前景展望。检