论文部分内容阅读
高通量生物实验技术的进步,极大的促进了生物数据的产生.通过计算方法来研究生物系统中基因的功能及其分子作用机理已成为生命科学、应用数学和计算机科学等交叉科学领域中研究的重点和热点.在微观的层次上,生物系统的功能是由蛋白质,DNA,RNA等生物分子相互作用完成的.在不同的生命周期中或外部条件下,特定功能相关的基因构成的生物通路表现出活性,行使特定的生物学功能.识别这些生物通路可揭示基因的功能和作用机制以及生物系统的运行规律,并对进一步设计治疗人类疾病的药物提供帮助.本文运用运筹学中的方法作为基本工具,以静态的生物分子网络和动态的基因表达以及蛋白质质谱数据为基本的研究材料,提出一些识别活性生物通路的方法,具体包括以下几个方面的内容:
●总结了迄今为止的识别生物通路的方法,对两种不同类型方法的计算模型进行了分析和分类,并总结了可供使用的软件.指出现有方法的优缺点的同时,对该方向的研究进行了探讨和展望。
●提出一种基于混合整数规划模型的识别生物分子网络中生物通路的计算方法.该方法整合蛋白质相互作用网络和基因表达数据,使用精确的求解策略,改进了基于模拟退火算法的识别方法不稳健的缺点.在两种物种的实验数据中识别到的活性通路具有与实际相符的生物学意义。
●针对一个研究小鼠肝癌的具体生物问题,设计了几种识别不同特性活性通路的方法.通过使用不同方法进行分析和比较,得到小鼠Myc基因相关的通路在肝癌发病过程中的作用机制以及一条作用通路。
●基于蛋白质相互作用网络的全局拓扑性质,建立了基因与活跃程度的回归模型.该模型同时体现了复杂网络中的模块化性质和基因在特定条件下的活性.在人类疾病的研究中,模型求解得到的活跃基因构成的活性通路被已有文献资料所证实.该方法提供了一种高效的整合不同数据的方式,可应用于大规模数据的整合问题。
●对特定疾病相关基因以至通路的识别,提出了一种集成蛋白质相互作用和表型数据的不同特征的疾病基因预测方法.除了能根据与疾病的关联程度对基因进行排序以外,学习得到的特征权重可揭示不同特征在疾病基因预测中的重要性,具有可解释性。