论文部分内容阅读
目的:慢性阻塞性肺疾病(简称慢阻肺)诊断及分级的金标准为肺功能检查,但较高的应用成本使其未能广泛应用于基层医疗机构,初筛及判别模型的建立减少了由上述原因导致的漏诊率,增加了慢阻肺的诊断率。本研究旨在对比不同模型对慢阻肺的初筛及判别效力,进而建立适合中国沈阳地区的慢阻肺初筛及判别模型。研究方法:收集2017年12月至2019年4月就诊于中国医科大学附属第一医院肺功能室并完成问卷及肺功能检查的慢阻肺患者及肺功能正常对照组。验证广东版模型在沈阳地区的筛查效力。应用一般线性回归(多元线性回归)、广义线性回归(逻辑回归)、线性判别分析以及K-最邻近法(KNN)、决策树、条件决策树和支持向量(SVM)分别构建模型并比较模型之间的筛查效力,选择最适合中国沈阳地区人群的二分类初筛模型及疾病严重程度判别模型。结果:1、本试验共收集慢阻肺患者232例,其中男性128例,女性104例,年龄在40-80岁,轻度、中度患者124例,重度、极重度患者108例。对照组115例,其中男性42例,女性73例,年龄在40-80岁。2、运用广州地区模型对沈阳地区样本进行预测校验,将判断患病与否作为目标,预测准确率分别为:不患病:0.9826、患病:0.4483,整体精确度:0.6254。将判断疾病严重程度为目标,准确率分别为:不患病:0.9826、轻度慢阻肺:0.0403、重度慢阻肺:0.5556,整体精确度:0.5130。3、将判断患病与否作为目标,通过比较各模型间的F1值及AUC值,得出逐步逻辑回归为最优筛查模型。将判断疾病严重程度为目标,通过比较各模型间的精确度,得出决策树为最优判别模型。4、利用R语言软件基于AIC值进行逐步逻辑回归变量筛选及模型建立,得出文化程度(x4)、气促(x5)、烹饪燃料级(x6)、吸烟指数(x7)、家族史(x9)、BMI(x11)、农民(x16)、母亲怀孕烟雾接触(x17)、厨房通风(x18)、儿时取暖(x19)、目前取暖(x20)为筛查模型的最佳变量。初筛模型:Y=-3.6522-1.1012X4+3.0346X5+0.9241X6+1.1462X7+1.7173X9-0.3096X11+2.2282X16+1.2225X17-0.5788X18+0.9945X19+0.7663X20。基于决策树的信息值,得出气促(x5)、烹饪燃料级(x6)、吸烟指数(x7)、BMI(x11)、咳嗽(x12)、农民(x16)、厨房通风(x18)、儿时取暖(x19)为判别模型的最佳变量。判别模型:5、对模型进行考核,初筛模型0.084为最佳临界点,AUC值为0.941。判别模型回代准确率分别为:不患病为0.9884、轻度慢阻肺为0.6522、重度慢阻肺为0.7901,整体精确度为0.8038;预测准确率分别为:不患病为0.8571、轻度慢阻肺为0.5934、重度慢阻肺为0.7901,整体精确度为0.7778。结论:逐步逻辑回归为沈阳地区慢阻肺最优筛查模型,决策树为沈阳地区慢阻肺最优判别模型,可以较好的应用于中国沈阳地区慢阻肺的筛查与判别。