论文部分内容阅读
结直肠癌包括结肠癌与直肠癌,是我国最常见的恶性肿瘤之一,目前在全球范围内,结直肠癌发病率、死亡率在所有恶性肿瘤中均位居第五位。根据美国国立癌症研究所最新统计报告显示,结直肠癌患者5年生存率为64.4%,而我国结直肠癌患者5年生存率不到48%。因此研究结直肠癌患者的生存期对于医生临床决策和评估患者预后、改善治疗方案都具有重要意义。通常癌症患者生存期的预测依靠医生利用临床数据或评分系统并结合主观经验做出判断,预测准确性不高,随着现代信息技术快速发展,基于机器学习的数据挖掘、大数据分析的规范应用,已经构建了众多疾病预后模型有助于改善此类预测。本文针对结直肠癌患者指标变量复杂且数据量大等特点,提出了基于深度置信网络(Deep Belief Network,DBN)的结直肠癌患者生存期预测模型,协助医生评估患者预后,改善治疗方案,进而提高结直肠癌患者生存能力。研究的主要内容如下:(1)基于DBN结直肠癌生存期预测模型的构建。通过受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)的构建与堆叠建立深度置信网络,在顶层使用BP神经网络进行反向参数调优,生成DBN预测模型。针对DBN模型中网络深度选择难的问题,采用基于RBM训练的重构误差自主确定隐含层层数,提高了模型拟合能力。(2)数据预处理与模型调优。从SEER数据库中依据NCCN临床指南、AJCC第7版癌症分期指南以及相关研究文献,筛选出与结直肠癌密切相关的数据集,对提取的数据进行预处理包括:聚类降维、数值化、数据清洗以及归一化。结合初步构建的模型,使用处理后的数据对网络参数进行优化,进而确定适合结直肠癌患者生存期预测的最优DBN模型结构。最后与经典BP神经网络模型处理结果对比,实验结果表明基于深度置信网络模型的预测准确率更高。(3)系统设计与实现。结合论文中已经构建出最优结构的DBN预测模型,开发并实现了结直肠癌生存期在线预测系统,为医生评估结直肠癌患者预后和临床研究提供了一种实践手段和途径。