论文部分内容阅读
目的:儿童哮喘是一种严重影响小儿身心健康的呼吸道疾病,近年来儿童哮喘的患病率及死亡率均有上升趋势,影响着世界上9.6-13%的儿童,造成巨大的经济和社会负担,婴幼儿由于气道发育还未完善,易受周围环境因素的影响,是儿童哮喘的高危人群,80%的哮喘症状发生在3岁以前。随着年龄的增长,气道及免疫系统的发育逐渐完善,有一部分儿童会痊愈,而另一部分儿童在学龄期将依旧患有哮喘,并将接受终身治疗,故预测学龄期是否会持续患有哮喘是至关重要的。本研究基于BRFSS数据库,应用人工神经网络的方法,提供一种简单易行的儿童哮喘预测模型,有利于加强对哮喘高危儿童的健康管理,缓解医疗资源的压力,改善患者健康水平和生活质量。方法:在BRFSS数据库中下载哮喘回访调查ACBS数据,选取2011-2014年间参与回访调查的哮喘患者数据。根据最新哮喘GINA指南、前人的相关研究,并且咨询了临床专家,初步从数据库中筛选出20项特征变量,包括:家长哮喘史、家庭收入、出生月份、保险、母亲生产时年龄、被动吸烟、肥胖、慢阻肺/慢性支气管炎史等。结局变量为学龄期是否患有哮喘。随后,通过缺失值处理、数据转换、数据的离散化等操作对数据进行预处理,并按照70%:30%的比例将数据划分为训练集和测试集。应用统计学方法,及信息增益理论结合Python语言中Feature_Selection特征筛选器两种方法,对预测变量进行筛选。针对传统人工神经网络会出现梯度弥散的现象,使用随机梯度下降算法对模型进行改良,利用训练集不断学习调整参数设置,构建出最优预测模型,利用测试集对模型进行评估,评估指标有准确度、灵敏度、特异度和ROC曲线下面积。最后,将所建模型与Logistic回归、支持向量机、决策树算法所建模型进行比较分析。结果:经数据预处理后,共包含930名儿童,其中学龄期患有哮喘的有587名,痊愈的有343名,阴阳性样本数量比为1:1.71,较为均衡。经两种特征变量的筛选方法比较,最终选取的高相关预测变量集包括:哮喘史、被动吸烟、确诊年龄、吸入器使用是否正确、家长受教育程度、家庭收入、出生月份。基于优化后的BP人工神经网络构建的预测模型准确度为73.4%,灵敏度为72.7%,特异度为69.3%,ROC曲线下面积为0.731.模型性能要优于Logistic回归模型、决策树及支持向量机模型性能。结论:本研究以儿童哮喘患者为研究对象,基于人工神经网络算法构建哮喘预测模型,准确度为73.4%,灵敏度为72.7%,特异度为69.3%。通过随机梯度下降算法优化了模型性能,提高了准确度。应用的预测变量全部为行为风险因素,极大地改善了患儿的依从性,有利于开展临床一级与二级预防工作,提高患者健康水平和生活质量。