基于数据整合与最优化方法的生物通路识别研究

来源 :中国科学院数学与系统科学研究院 | 被引量 : 0次 | 上传用户:quixotic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量生物实验技术的进步,极大的促进了生物数据的产生.通过计算方法来研究生物系统中基因的功能及其分子作用机理已成为生命科学、应用数学和计算机科学等交叉科学领域中研究的重点和热点.在微观的层次上,生物系统的功能是由蛋白质,DNA,RNA等生物分子相互作用完成的.在不同的生命周期中或外部条件下,特定功能相关的基因构成的生物通路表现出活性,行使特定的生物学功能.识别这些生物通路可揭示基因的功能和作用机制以及生物系统的运行规律,并对进一步设计治疗人类疾病的药物提供帮助.本文运用运筹学中的方法作为基本工具,以静态的生物分子网络和动态的基因表达以及蛋白质质谱数据为基本的研究材料,提出一些识别活性生物通路的方法,具体包括以下几个方面的内容:   ●总结了迄今为止的识别生物通路的方法,对两种不同类型方法的计算模型进行了分析和分类,并总结了可供使用的软件.指出现有方法的优缺点的同时,对该方向的研究进行了探讨和展望。   ●提出一种基于混合整数规划模型的识别生物分子网络中生物通路的计算方法.该方法整合蛋白质相互作用网络和基因表达数据,使用精确的求解策略,改进了基于模拟退火算法的识别方法不稳健的缺点.在两种物种的实验数据中识别到的活性通路具有与实际相符的生物学意义。   ●针对一个研究小鼠肝癌的具体生物问题,设计了几种识别不同特性活性通路的方法.通过使用不同方法进行分析和比较,得到小鼠Myc基因相关的通路在肝癌发病过程中的作用机制以及一条作用通路。   ●基于蛋白质相互作用网络的全局拓扑性质,建立了基因与活跃程度的回归模型.该模型同时体现了复杂网络中的模块化性质和基因在特定条件下的活性.在人类疾病的研究中,模型求解得到的活跃基因构成的活性通路被已有文献资料所证实.该方法提供了一种高效的整合不同数据的方式,可应用于大规模数据的整合问题。   ●对特定疾病相关基因以至通路的识别,提出了一种集成蛋白质相互作用和表型数据的不同特征的疾病基因预测方法.除了能根据与疾病的关联程度对基因进行排序以外,学习得到的特征权重可揭示不同特征在疾病基因预测中的重要性,具有可解释性。
其他文献
校园媒介是提升大学生媒介素养教育的有效阵地,本文以广西师范大学校园媒体和学生为样本,对高校大学生媒介素养现状和高校校园媒体的互动发展进行研究,认为在网络媒体背景下,
学位
在过去的三十年中,声学和电磁学反散射问题是应用数学中很活跃的一个领域。散射问题中的正问题是根据入射场和方程的信息来计算散射场,而反问题则是根据散射场的信息去反演散射
本文第一部分用Sacks-Uhlenbek[SU]的扰动泛函方法研究了紧黎曼曲面上的纤维型是紧辛流形的纤维丛上的Yang-Mills-Higgs泛函的临界点,并证明了一个与2维调和映照的存在性类似
党的十六大把加强党的执政能力建设作为新世纪、新阶段党的建设的一个重要内容,这是党中央站在时代发展的高度,向全党提出的新要求,我们要深刻理解这一新要求的重大意义,不
本文对FDI(国际投资)理论研究的很多主流学派进行概述,主要包括垄断优势理论、产品生命周期理论、区位理论、比较优势投资理论、内部化理论、国际生产折衷理论、依附理论、投
基层党组织是执政党的根基所在。兰州铁路局党委把加强党的执政能力建设,作为落实“三个代表”重要思想、推动企业发展的重要内容,强化党的基础建设,强化党组织作用的发挥,
本论文主要研究由偏微分方程描述的弹性振动系统的输出反馈镇定问题。着重于输出反馈镇定器的设计以及包括稳定性在内的闭环系统的动态特征分析。   第一部分,考察了Euler-
拟合优度检验在统计理论中有着特殊的地位,不仅是统计理论的基础组成部分,而且和实际应用有密切关系。随着科技的发展与进步,它在产品生产领域、质量检测领域、工程领域、地学等
集值映射是现今关注较多的一个数学方向,无论是在基础理论研究,还是在应用方面,均十分活跃。   本文主要分为两部分,第一部分讨论标量集值优化问题,第二部分讨论Hahn-Banach定