过程工业数据挖掘算法和应用的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:gdlcws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在石油、化工等过程工业的生产实践和科学研究中,会产生大量的原料、产品、设备、工艺和操作信息等方面的数据。提取这些数据中包含的知识,即过程工业数据挖掘,是过程系统工程的重要研究领域,也是模拟、监控、优化、故障诊断等工业实际应用的基础。过程工业数据挖掘的主要难点包括:如何建立适用的数据挖掘算法,这些算法能够适应过程工业数据的复杂特性,如大数量、高维数、强相关性、包含噪音、动态性等;如何将这些算法整合为从数据到知识的挖掘系统,使它们能协调工作,解决实际问题。 常减压精馏装置是原油炼制系统中的重要组成部分,具有一般连续石油化工生产过程的各种典型特性。该文以此为主要背景,研究过程工业中的数据挖掘。 为了得到数据集中不同属性间的关联关系,该文采用数量型关联规则提取的方法。在基于Apriori搜索的基本算法的基础上,提出了从原始数据集到目标数据集的有效映射的概念,可同时完成格式转换和信息传递,适用于各种类型数据的挖掘;提出了模糊分配系数,根据此系数确定模糊离散化的参数,可以简单有效地控制离散化中的模糊程度,减少分段和边界值等偶然因素对结果的影响。 针对过程工业数据的动态特性,进行了以下研究:采用时间窗口上的差分方法,提取多维时间序列的趋势变化信息并建立规则;将频繁项集上的Apriori性质扩展到项集处于不同时间点的情况下,完善了事务间关联规则提取的算法理论,并采用该算法分析时间轴上的属性间变化的因果性;文中还讨论了系统特性对不同时间尺度下的规则的影响,以及多维关联规则中的混合有效映射和规则的评价标准。 为了解决复杂的实际问题,建立了以多个功能模块整合而成的过程工业数据挖掘系统,并将它应用于以下两个问题中:在药物设计中,确定结构参数与活性间的关联关系;利用DCS数据,分析常减压精馏装置的运行特性,并建立侧线润滑油产品粘度的经验模型,利用数据挖掘的结果可以减少输入参数,选择合适的训练样本,保证模型的精度。这些结果验证了数据挖掘系统的有效性。
其他文献
2013年12月18日下午,“工·在当代——2013第九届中国工笔画大展”在中国美术馆盛大开幕。本届展览由中国美术家协会、中国美术馆、中国工笔画学会联合主办,展览展出146位艺
本文首先介绍了水平井钻井液的设计要求、研究水平和发展趋势.其次分析了文昌油田的储层物性特征、潜在损害因素,并对储层保护现状进行了调研,分析了储层的损害机理.在此基础
  The goal of generic pharmaceutical R&D is to successfully develop and submit quality generic products to regulatory authorities.To ensure a successful submi
会议
本研究以水为主要体系,并在现代精馏设备所涉及的孔结构范围内,分别考察得出了加工条件(毛刺、表面粗糙度)对孔流系数的影响;孔流系数在不同孔结构下随雷诺数和液体压头的变
疏水缔合聚合物因其溶液独特的耐温耐盐性能而使它在三次采油中具有良好的应用前景.本论文通过测定实验室合成的疏水缔合聚合物溶液的粘度,考察了疏水缔合聚合物的长期热稳定
本文运用超临界流体反溶剂结晶技术进行制备沥青质微粒的研究.实验中,研究了不同溶剂、不同沥青质、超临界丙烷三元体系的反溶剂结晶行为.确定了大港减渣沥青质-甲苯-超临界
蛋白激酶是一类催化蛋白质磷酸化反应的酶,在细胞信号转导通路中起着十分重要的作用,能够调控细胞的生长、增殖、侵袭迁移、存活等。目前在多种肿瘤细胞中发现蛋白激酶过度激活
  Generally speaking, linear conpolymers whose stability increased accompany with the adding of molecular weight, has hindered further adhibition of polymeric
会议
自“多莉”诞生以来,体细胞核移植技术在家畜中的应用的到了长远的发展。以转基因体细胞为供体细胞,利用核移植技术成产转基因家畜成为研究的热点。本研究拟构建骨骼肌特异表
本文以小麦(Triticum aestivum Linn.)和摩西球囊霉菌(Glomus mosseae)为材料,通过蛭石+水培试验,研究了摩西球囊霉菌对Pb、Cd胁迫下小麦的各种理化指标的影响,包括形态、鲜重和