论文部分内容阅读
空气检测设备的技术虽然在不断更新,然而当下的空气检测设备仍然存在准确度低、鲁棒性差和无设备故障检测等问题。随着机器学习、深度学习和人工智能等一系列的新型算法和模型不断地应用于新领域,如何有效改进传统空气检测设备中的识别算法和气体传感器阵列的故障检测成为了人们深入研究的热点。本文首先面向空气检测技术中应用的机器学习算法,选择有代表性的KNN算法,展开算法改进研究。目前的KNN算法应用中,空气质量的样本数据集有着非常严重的样本倾斜问题,正负样本数量差值甚大,这会导致KNN算法在呈现离散性分布的样本数据中存在预测效果差,甚至无法预测的问题。为此,本文尝试改KNN算法的模型结构,进一步改进KNN算法,提出一种新型算法P.A-KNN。在算法中,将Ada Boost算法融合进KNN,让KNN针对训练集做欠采样构造若干个弱分类器,集中弱分类器形成强分类器,通过循环迭代,使得分析结果逐步优化,最终达到更为准确的预测结果。本文采用上海市2017年到2019年的部分空气质量真实数据,仿真实验得到了较好的效果,实验结果表明改进的P.A-KNN算法在空气检测及预测效果上更好,准确性最高可达98.69%,较传统KNN算法预测效果提升了11%。本文针对空气检测设备中气体传感器阵列的故障检测存在的问题进行了模型设计。传感器设备的问题直接影响检测出的气体数据的值,传感器阵列的好坏对检测结果有着很明显的影响,诸如零值、偏大值或偏小值等异常数据会直接影响空气质量等级的评定,容易造成结果夸大或结果被忽视等问题。对此,本文提出基于KNN规则对气体传感器阵列进行故障检测,通过主成分分析(PCA)进行降维,引入K折交叉验证方法找到最优K值,改进了KNN检测模型,使模式识别误识率进一步降低。仿真实验结果显示,故障检测准确率由91.5%提高至97.8%,可以看出,改进后的模型能够实现阵列气体传感器故障的在线诊断与定位,并可适用于其它类似检测设备的系统。