机器学习算法建立妊娠期高血压疾病预测模型

来源 :汕头大学 | 被引量 : 0次 | 上传用户:rfg45y5465u5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景及目的:
  妊娠期高血压疾病(hypertensive disorders of pregnancy, HDP)是妊娠期特有的疾病,也是孕产妇和围生儿死亡的主要原因之一。早期诊断并干预可减少不良事件的发生。本研究采用不同的机器学习算法建立妊娠期高血压疾病预测模型,比较各模型的预测效能,获得最佳妊娠期高血压疾病预测模型。通过建立妊娠期高血压疾病预测模型,筛选出早期高危人群,达到重点监测和干预、改善疾病预后的效果。
  方法:
  建立妊娠期高血压疾病前瞻性队列,入选2014年3月至2018年12月汕头大学医学院第一附属医院妇产科门诊产检的早期(孕7-18周)孕妇,在孕24周、32周、36周及产后12周进行随访。随访内容包括:问卷填写、血压测量、生化指标检测及其他产科检查,登记妊娠期高血压疾病发生情况。对数据缺失超过30%的连续变量进行删失处理,数据缺失小于30%的连续变量,用多重填补法预处理。按7:3的比例将入选者随机分入建模组和验证组,以建模组数据进行模型拟合,验证组数据进行模型内部验证。本研究进行两次模型拟合,第一次:采取Lasso(Least absolute shrinkage and selection operator)算法对建模组数据变量进行筛选,继而采用Lasso-logistic、随机森林、神经网络及支持向量机四种机器学习算法分别建立四个妊娠期高血压疾病预测模型,用ROC曲线评估各模型的优劣,筛选出预测准确度最佳的模型。第二次:依据最佳模型中各预测指标系数权重,将预测指标组合成线性方程,计算出模型评分。将“年龄”和“初产妇”指标强制纳入分析,与模型评分一起构建列线图。
  分别采用Hosmer-Lemeshow拟合优度检验、校准曲线和ROC曲线对构建的列线图模型进行评估。用决策曲线评估模型的临床效能。最后,将模型设计成网页小程序,以提高模型的临床操作性。
  结果:
  1.研究共纳入5067例妊娠早期妇女,3773例孕妇完成随访。对数据进行多重填补后,3197例纳入分析,其中建模组2258例,59例(2.61%)诊断为妊娠期高血压疾病。验证组939例,31例(3.30%)诊断妊娠期高血压疾病(妊娠期高血压疾病包括妊娠期高血压?子痫或子痫前期)。
  2.Lasso算法筛选出妊娠期高血压疾病的预测指标:高体重指数、高收缩压、高舒张压、高白细胞、高血小板、高空腹血糖、有尿红细胞、有妊娠期高血压疾病、有妊娠期高血压疾病家族史、孕早期重度生活压力及重体力活动量。将预测指标分别纳入Lasso-logistic、随机森林、神经网络和支持向量机算法运算,建立四个妊娠期高血压疾病预测模型,通过ROC曲线评估每个模型的预测准确度。其中Lasso-logistic回归算法建立预测模型的预测准确度最佳(Lasso-logistic、随机森林、支持向量机和神经网络算法建立的模型进行ROC分析:建模组中AUC分别为0.816,95%Cl:0.754-0.879;0.780,95%Cl:0.716-0.844;0.816,95%Cl:0.750-0.882和0.780,95%Cl:0.711-0.848。验证组中AUC分别为0.795,95%Cl:0.709-0.881;0.516,95%Cl:0.485-0.548;0.638,95%Cl:0.528-0.747和0.719,95%Cl:0.621-0.817)。
  3.依据筛选出的Lasso-logistic模型系数权重,将预测指标组合成线性方程,计算出模型评分。将年龄、初产妇、模型评分构建列线图模型,在建模组及验证组AUC分别为0.847,95%Cl:0.805-0.889和0.753,95%Cl:0.653-0.853。
  4.列线图模型校准曲线和Hosmer-Lemeshow拟合优度检验提示模型预测准确度高。用决策曲线评估预测模型的临床效益,当妊娠期高血压疾病发病率在0-13%时,该预测模型具有较好临床预测效果。
  结论:
  Lasso-logistic回归算法建立妊娠期高血压疾病模型是4个预测模型中预测准确性最佳的模型,适合临床运用。高体重指数、高收缩压、高舒张压、高白细胞、高血小板、高空腹血糖、有尿红细胞、有妊娠期高血压疾病、有妊娠期高血压疾病家族史、孕早期重度生活压力及重体力活动量是妊娠高血压发生的危险因素,共同组合成模型评分。高模型评分、高龄、初产妇是妊娠期高血压疾病的独立危险因素。本研究建立的模型预测准确性高、临床操作性强。
其他文献
背景和目的:  近年来,中国非酒精性脂肪肝(NAFLD)的患病率及发病率逐年上升,因非酒精性脂肪肝及其并发症而造成的经济负担大大增加,而心血管疾病(CVD)是非酒精性脂肪肝常见的并发症之一。研究证实,NAFLD患者首要死亡病因是心血管疾病,而不是肝病。目前,关于NAFLD对冠心病之间的关系一直都有争论,关于NAFLD是否是冠心病(CHD)的独立危险因素之一,NAFLD是否会加重冠心病的严重程度,以
背景  主动脉夹层(aortic dissection,AD)是主动脉腔内的血液从内膜撕裂后进入中层并沿着主动脉长轴纵向剥离扩张的心血管疾病。血管重塑和内皮退行性变是其发病机制之一,而本病的共同病理改变是平滑肌细胞缺失、弹性纤维断裂和胶原降解等。主动脉夹层患者血浆中的血管紧张素Ⅱ水平升高。以往学者使用AngⅡ灌注小鼠,组织学发现其主动脉内膜明显增厚,中膜变薄呈退行性改变,进而形成主动脉夹层,这提示
学位
目的  探讨汕头大学医学院第一附属医院100例克罗恩病(CD)患者的临床特征和治疗情况,提高对本病的认识,规范诊疗方法,减少对该病的误诊及漏诊,提高患者的疗效及预后。  方法  通过回顾汕头大学医学院第一附属医院2013年1月1日至2019年8月31日期间确诊的100例CD患者的临床资料,对患者的临床表现、蒙特利尔分型、消化内镜特征、影像学表现、病理学检查、实验室检查、手术情况及治疗方案等进行分析
学位
期刊
背景:主动脉内径是预测主动脉出现夹层、破裂的重要指标,也与器官损害有关。高血压、冠心病、主动脉瓣关闭不全常导致主动脉扩张。2型糖尿病(diabetes mellitus,DM)是已知的心血管危险因素,但它与主动脉内径的关系仍有争议。  目的:评估2型DM与主动脉内径的关系。  方法:对武汉亚洲心脏病医院2018年1月至2018年12月的住院患者进行回顾性分析。根据有无2型DM将患者分为糖尿病(DM
学位
期刊
背景:  急性主动脉夹层(Acute aortic dissection,AAD)作为高病死率的危重症心血管疾病,近年在国内发病率呈上升趋势。在临床上,对发病患者进行危险分层显得尤为重要。因此,AAD的相关死亡危险因素也越来越得到关注。血脂被发现与AAD短期预后相关,但关于血清低密度脂蛋白胆固醇(Low density lipoprotein cholesterol,LDL-C)与AAD患者长期死
目的:通过检测血清胸腺基质淋巴细胞生成素(TSLP)、炎症因子水平,分析TSLP、炎症因子与脓毒症患者及预后的相关性。  方法:回顾性分析2017年01月~2019年01月我院收治的80例脓毒症患者的临床资料,根据标准分成脓毒症组、脓毒性休克组及对照组,监测其血清TSLP、IL-4、IL-10、TNF-α、IFN-γ浓度。将发病后28天救治无效死亡的10例患者作为病死组,其余40例患者作为存活组,
学位
学位