基于多组学数据的癌症驱动通路识别算法研究

来源 :广西师范大学 | 被引量 : 2次 | 上传用户:laopengyou123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症驱动通路对癌症精准医疗和个性化医疗的重要性,使癌症驱动通路识别问题成为生物信息学的研究热点。由于高通量测序技术产生的组学数据具有噪声多和不完整的特点,且单一组学数据包含的信息有限。因此,通过整合多组学数据以提高数据完整性和准确性、充分利用不同组学数据的潜在信息非常重要。本文对基于多组学数据的癌症驱动通路识别问题展开研究,主要工作如下:通过整合体细胞突变、拷贝数变异和基因表达三种组学数据,提出改进的最大权重子矩阵问题模型IMWS。IMWS模型通过一条通路中基因的平均权重来调节覆盖度和互斥度,同时考虑基因之间的相关性,旨在识别具有高覆盖度和中等互斥度的单驱动通路。通过引入短染色体编码和基于贪婪策略的重组算子,提出求解IMWS模型的单亲遗传算法PA-IMWS。在真实生物数据集和模拟数据集上对算法GA、MOGA、iMCMC和PA-IMWS进行实验对比分析。实验结果表明,与其他三种算法相比,PA-IMWS算法能够识别具有高覆盖度、中等互斥度的基因集,并且在算法执行效率上具有较好的扩展性。通过整合体细胞突变、拷贝数变异和基因表达数据,提出改进的协作驱动通路问题模型ICMDP。该模型具有两个特征:(1)每个通路具有高覆盖度和中等互斥度;(2)协作驱动通路间的突变基因在癌症样本中呈现显著的共同突变,且协作驱动通路中基因具有相关性。通过引入短染色体编码和基于贪婪策略的重组算子,提出求解ICMDP模型的单亲遗传算法PA-ICMDP。在真实生物数据集上对算法CoMDP和PA-ICMDP进行实验比较。实验结果表明,PA-ICMDP算法能够识别涉及关键生物过程的多个重要协作驱动通路,比如细胞存活和蛋白质合成,该方法适用于挖掘与癌症发展相关的基因。进一步对ICMDP和PA-ICMDP进行扩展,提出EICMDP模型和PA-EICMDP算法,实验结果表明,扩展后的模型和算法能有效识别与已知通路发生协同作用的其他重要通路。综上所述,本文对癌症驱动通路识别问题进行研究,基于多组学数据,提出通路识别问题的模型和算法,这些方法可能成为检测癌症通路的有用补充工具。
其他文献
房地产工程管理的根本目的就是要进行合理的有计划的安排组织工程建设的整个过程,是整个开发项目能够成功实施的重要保证,也是提高项目开发效率,提高开发产品品质的重要环节
平原地区是保障首都生态环境可持续发展的重要生态区域。通过调查分析北京市大兴区东半壁店小流域基本情况,指出平原小流域内农村生活与工业污水、农业面源污染、防洪安全与
改造前,水泥联合粉磨系统台时产量偏低,系统粉磨电耗33kWh/t以上,循环提升机、循环风机故障多。主要采取的优化措施有:增加TS三分离选粉机,配料提升机等设备,将水泥磨联合粉
本文主要运用定性理论分析和计量工具为主的定量实证分析两种方法.通过建立相应的VAR模型,并对采集的行业相关的样本数据做模型设定、协整及平稳定处理、Granger因果关系检验
二战后的马来(西)亚经历了反抗英国殖民统治、争取国家民族独立的历史过程,在战后的最初二十多年里,正是马来人和华人的共同努力才使得国家获得独立和自由。但是,马华族群之
本文基于2010年底对全国6个省1 118个样本农户的调查数据,对农村各类生活固体垃圾的排放及其影响因素进行了实证分析。首先,运用调查数据描述农村生活固体垃圾排放量及排放结
运用各种手段和途径把统治阶级的意识形态注入到社会中去,是达到引领社会价值、整合社会力量、维护统治秩序的重要途径。高校一直是意识形态教育领域的重地,是各种意识形态相互
目的探讨开塞露使用护理操作改革与使用对功能型便秘的治疗效果,为临床提供参考依据。方法选择2016年1月到2018年12月在海丰县彭湃纪念医院住院期间出现便秘需要使用开塞露的
高等教育的首要目标是培养学生的实践动手能力和协同创新精神,科学地组建学生团队是实现这一目标的有效途径之一。研究总结出"小花园"学生团队的特点,解析出团队规模、性别构