预测转移性结直肠癌一线FOLFOX化疗疗效的人工神经网络模型的构建

来源 :福建医科大学 | 被引量 : 0次 | 上传用户:ychh1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:通过对转移性结直肠癌使用FOLFOX方案治疗患者的基因芯片分析,探讨并建立构建预测转移性结直肠癌一线FOLFOX化疗疗效的人工神经网络模型。方法:从GEO数据库下载GSE104645数据集,构建表达矩阵,对我科既往芯片数据(GSE69657)进行分析,构建表达矩阵。运用R 3.5.1软件Combat包对两套矩阵的表达值进行批间差(batch effect)校正。据FOLFOX方案疗效分为两组:敏感组(包括CR和PR)和耐药组(包括SD和PD)。将GSE104645数据集设为训练集,运用GEO2R平台对两组间的基因表达进行差异分析,取P<0.05,log2FC绝对值>0.33为阈值,筛选FOLFOX方案的耐药和敏感基因,采用STRING(functional protein association networks)在线工具进行差异基因的GO功能富集分析,以探索耐药相关基因所参与的生物学过程。运用IBM SPSS 22对GSE104645数据集进行FOLFOX方案疗效的人工神经网络模型(ANN)构建,随机将训练集按照7:3分为训练样本和测试样本。采用多层感知器(MLP)方法,设置2个隐藏层。待模型训练稳定后,导出xml格式模型(命名为FOLFOXpredict.xml)进行后续测试集回代验证。模型构建完毕后,对模型的输出端预测值,联合FOLFOX方案疗效(敏感或耐药),绘制受试者工作特征曲线(receiver operating characteristic curve,ROC曲线),对模型的预测精度进行内部验证。将我科芯片数据集(GSE69657)设置为测试集,在IBM SPSS 22软件中加载构建好的GSE69657表达矩阵和临床疗效参数,并运用FOLFOXpredict模型对测试集进行回代验证,通过预测结局,运用ROC曲线对测试结果和预测能力进行评价。结果:1对训练集(GSE104645)中的FOLFOX敏感组和FOLFOX耐药组的芯片数据进行比较,采用GEO2R进行差异基因的筛选,共筛选出2076个差异基因,其中822个基因在耐药组上调,1254个基因下调,下调基因为敏感基因。2对差异基因所参与的生物学过程进行GO分析,发现主要富集在物质代谢的调控过程中。包括细胞生物合成等初级代谢过程,RNA、氮化合物、大分子生物合成过程等,进一步提示物质代谢调节过程在FOLFOX的耐药中起的重要作用。3训练集中37例(68.5%)患者为训练样本,17例(31.5%)患者为测试样本。一共有39个基因纳入最终模型构建。这是一个包含2个隐藏层的神经网络模型,其在训练集中预测训练样本和测试样本的准确度分别为75.7%和76.5%,ROC曲线下面积为0.875。4将我科芯片数据集(GSE69657)设置为测试集,将构建好并进行批次效应校正后的表达谱矩阵导入IBM SPSS 22软件中。联合加载FOLFOX.mxl进行预测,并根据真实结局(敏感或耐药)进行监督。结果提示,该模型预测效能较好,ROC曲线下面积为0.778%。结论:本研究成功构建了基于芯片数据的转移性结直肠癌一线FOLFOX方案疗效的人工神经网络预测模型,并进行了独立的外部验证。模型稳定性好,预测效能强。此外,本研究结果提示与奥沙利铂耐药相关的基因功能主要富集在物质代谢的调控过程中。包括细胞生物合成等初级代谢过程,RNA、氮化合物、大分子生物合成过程等,进一步提示物质代谢调节过程在FOLFOX的耐药中起的重要作用。
其他文献
本课题以21CrMo10管模钢为研究对象,添加不同含量的稀土Ce,探究了稀土Ce对钢的组织、夹杂物、力学性能和热疲劳性能的影响。本文通过实验分析及热力学计算,取得如下研究结果:
要认真学习贯彻习近平总书记系列重要讲话精神,落实全面从严治党要求,抓党建、促党建,以党建引领带动各项工作,充分发挥基层党组织的战斗堡垒和共产党员的先锋模范作用,着力
目的:研究TIGAR对乏氧人食管鳞癌细胞放射敏感性的影响。方法:1)检测不同食管鳞癌细胞株(ECA109、KYSE410、KYSE450)内TIGAR的线粒体定位水平。用细胞线粒体分离试剂盒来裂解
随着我国“大众创业,万众创新”等一系列配套政策的颁布,我国中小企业也迎来了新的发展。然而众多中小企业在发展过程中不得不面临着融资难的问题,各界专家也在致力探索新的
目的:探讨LNK介导的JAK-STAT信号通路在高血压血管重塑中的作用。方法:使用大鼠胸主动脉平滑肌细胞构建高血压细胞模型。实验分为4组,分别为:空白对照组,AngⅡ+空白组,AngⅡ+空载组,AngⅡ+SH2B3重组质粒组。流式细胞仪检测VSMC周期、凋亡及增殖的水平;实时荧光定量PCR检测大鼠平滑肌细胞上LNK和JAK-STAT信号通路mRNA表达水平;蛋白免疫印迹法检测大鼠平滑肌细胞上LNK
科学技术迅猛发展,以信息技术为载体的科技、工业、金融、国防和教育等诸多行业发生着翻天地覆的变化。针对于此,结合高中物理学科以及高中物理教师的特点,本文就从什么是现
研究乡村聚落的空间格局及其影响因素,揭示乡村聚落空间布局与自然地理、生态环境及生产生活之间的关系,对更好的实现国家关于“优化乡村发展布局”、“合理有效利用土地资源”具有重要的现实意义。文章以岷江上游河谷地区的理县为例,针对聚落空间布局现状,结合自然、生态、社会等相关因素,应用聚落生态位的理论,在GIS技术支撑下建立理县乡村聚落空间数据库,并分析聚落的空间布局适宜性,能够为优化聚落空间布局提供参考。
目的:探讨TRPC6基因多态性与原发性高血压伴发心房颤动的相关性。方法:将纳入研究的患者分为两组进行病例对照研究,原发性高血压伴发心房颤动的患者共354例为实验组,原发性高血压的患者共483例为对照组。选择TRPC6基因的2个SNPs(rs10501981、rs3824934),采用多重聚合酶链反应(mPCR)和高通量测序对TRPC6进行基因分型。结果:TRPC6基因的rs10501981的等位基
半导体工艺水平逐步强大,器件的尺寸逐渐微缩化,Al_2O_3薄膜因为自己本身的高介电常数、高带隙、高透光率得到广泛的研究。其作为新型高介电的栅介质材料,介电常数k约等于9,而目前普遍使用的材料Si O_2的介电常数只是它的一半;作为场效应晶体管中的绝缘层时等效氧化厚度变大,遂穿电流变小,器件性能可以得到有效提升。在Al_2O_3薄膜的制备方法中,原子层沉积技术(ALD)生长的薄膜纯度、均匀度、及质
不必要的结构振动会加速其疲劳损坏,缩减其使用寿命,影响结构的正常工作,严重时还会导致事故发生。有效解决结构体中出现的因振动问题带来的危害变得越来越重要,因此,振动抑制一直是科研工作者们关注的热点与亟待解决的难题。本文以压电悬臂梁为研究对象,提出一种镜像电路对自感知压电结构进行信号解耦,并结合经典PID控制算法作为控制策略,从理论推导和实验验证两个方面对压电悬臂梁复合结构的自感知振动抑制进行研究,主