论文部分内容阅读
随着生物技术的发展,越来越多的数学方法被用于解决生物问题。图论是一门研究目标关系与结构的数学分支。在研究生物RNA-seq数据对比,蛋白质作用网络分析,疾病-药物关联以及药物-药物相似性等问题中起到了重要的作用。这里,我们介绍生物数据的处理和分析,药物重定位的重要性,基于图论中连通度的考虑,提出了把扩散映射用于药物重定位的新方法。并对疾病核心信号网络进行发掘,对疾病的诊断和治疗提供新的参考方法和工具。最后,我们介绍图的[r,s,c,t]-染色及一些特殊图的[r,s,c,t]-色数。
在第一章中,我们首先介绍生物数据的类型,处理方法及分析。我们给出基因表达数据,SNP数据,RNA-seq数据和DNA-甲基化数据的背景和处理方法。对于基因表达数据和SNP数据,我们在第四章实例分析中CONEXIC的方法利用髓母细胞瘤的样本数据对疾病进行分类,找到差异表达基因和核心信号网络,以及可用于重定位治疗这一疾病的药物。对于RNA-seq数据,我们与BaylorCollegeofMedicine合作,对乳腺癌肿瘤干细胞样本的RNA-seq数据进行分析,找出肿瘤干细胞的生物标记和异常的信号作用网络,并对作用于肿瘤干细胞的药物作用图谱进行分析,以找到药物作用机制。对于DNA甲基化数据,我们与TheMethodistHospitalResearchInstitute的Choi,Dongsoon合作,探究治疗乳腺癌干细胞的一种药物组合。我们从多个方向探索药物对干细胞的作用机制,其中之一就是通过对药物治疗前后干细胞的DNA甲基化数据的分析,寻找药物对于全局DNA甲基化程度的改变,基因转录起始点(transcriptionstartsite,TSS)附近的差异甲基化表现,以及最终估计药物作用机制(基因功能与信号通路)。
在第二章中,我们介绍药物重新定位的背景和方法。要找到治疗疾病的新药物,需要我们花费大量的精力与成本。新药物上市需要经过许多阶段的测试,从目标识别到药物批准需要10到17年的时间。药物重新定位可以把10到17年的过程减少到3到12年。由此可见,把已经经过临床检验的药物进行重新定位,是发掘药物的快捷方法。我们首先介绍两种可用于药物重定位的方法,cMap和PRDICT。随后,我们给出了把扩散映射用于药物重定位的新方法,并在第四章中用于髓母细胞瘤的实例分析中。扩散映射的方法与图论中两点之间的联通度紧密相连。连通度越高,扩散距离越小。我们用扩散距离来寻找与疾病反相关度最大的药物,并进行实验验证。实验结果显示,与cMap方法相比,我们的方法更加有效。
第三章中,我们介绍了生物蛋白质作用网络和信号通路网络。蛋白质通过相互作用对细胞功能进行调控。我们介绍了许多蛋白质作用数据库,这些数据库为我们研究生物功能提供了很好的参照。但是,信号通路网络包含的蛋白质太少,蛋白质-蛋白质作用网络可靠性不高,所以,我们把网上的数据库里的信号通路网络和蛋白质作用网络整合到一起,并给出信号作用的可靠度衡量,为基于网络的生物分析方法提供了相对可靠和完备的背景参考。以它为背景,输入疾病主导基因,应用扩散映射的方法,我们可以找到疾病核心作用网络,对疾病异常功能研究提供了很好地工具。
在第四章中,我们把药物重定位方法与最优子网络发掘方法用于髓母细胞瘤这一儿童恶性肿瘤上来发掘可重新定位的药物和疾病核心信号网络。髓母细胞瘤是最常见的恶性儿科脑瘤,包含许多不同的子类型。每种子类型的基因模式都不一样。虽然组合治疗方面有了一定的进步,比如手术切除,放射治疗和化学疗法,但是效果不是很好,而且高强度的治疗会引发严重的神经或认知障碍。毒性比较小的靶向药物在治疗髓母细胞瘤发面很有前景。髓母细胞瘤是罕见的疾病,对新药物的发掘方面所做的投入比较有限。把已经存在的,可用于临床的药物重新定位于新的用途是药物发掘的有效,快速的途径,因为已存在的药物已经有可以利用的临床和药物代谢的数据,并且经过了相关安全检测。虽然一些信号通路抑制复合物已经被测试于髓母细胞瘤的SHH和Wnt信号通路功能异常的子类型,但是,对于剩余的髓母瘤细胞病人,被称为非SHH非Wnt(NWS)子类型,重新定位己存在药物是个很大的挑战,因为对于这一个子类型的病人,没有发现主要的功能异常的信号通路。这里,我们打算结合可利用的髓母细胞瘤基因数据与connectivityMap(cMap)数据库的药物治疗数据,重新定位现有的药物用于治疗NWS类的髓母细胞瘤。为了降低药物治疗高维数据空间的噪音,我们利用流形学习的方法对现有的治疗药物进行排序来抑制NWS类髓母细胞瘤。这种方法考虑药物的全局效用距离。为了说明药物对NWS类髓母细胞瘤潜在的作用机制,我们建立一个整合的作用网络。在这个网络的基础上,我们再次利用流行学习的方法去发掘一个核心信号网络,用于联接这些有效药物的作用目标与NWS主导致病基因。为了验证我们发现,我们在NWS髓母细胞瘤细胞株,MED8A,上测试作用于核心信号通路的药物。令人惊喜的是,排名靠前的药物显示有效的抑制率。与cMap的药物重新定位的方法相比,我们的方法有非常明显的提高。另外,在我们预测的核心信号通路中的其他的有效目标基因与主导基因联接很近。
在第五章中,我们介绍图论的背景知识,并提出了[r,s,c,t]-染色的定义。然后我们给出了当图G的最小度为1或者图G是偶圈时的[rs,c,t]-色数。