论文部分内容阅读
本文主要利用计算方法对于疾病和药物相关的生物信息学领域的重要问题进行了探索,具体内容如下:
1.基于蛋白作用网络的基因选择
受谷歌搜索引擎背后的网页排序算法(PageRankalgorithm)的启发,我们提出了如下假设:如果一个基因编码的蛋白在蛋白相互作用网络(protein-proteininteractionnetwork)中与许多重要的基因编码的蛋白存在相互作用,那么这个基因本身也很重要.基于这一假设,我们提出了基于网络的支持向量机-递归特征删除方法(NETwork-basedSupportVectorMachineRecursiveFeatureElimination,NET-SVM-RFE).实验结果表明我们的方法倾向于选择比经典的SVM-RFE更少却与生物本身更相关的基因,却仍然能够维持一样的预测精度.
2.致病基因识别
基于如下两个考虑:(1)潜在的疾病相关的基因在网络中应该倾向于出现在种子基因的附近;(2)仅仅是那些和候选基因在同一个模块里面的种子基因才会有利于致病基因的预测.我们提出了模块化的候选致病基因排序算法(ModularizedCandidateDiseaseGenePrioritizationAlgorithms,MCDGPA),这是一个一般性的算法框架,可以识别潜在的和疾病相关的基因,并允许结合许多先前的基因排序方法并且改善它们的算法精度.通过交叉验证和潜在的疾病相关基因预测,我们论证了MCDGPA在预测精度上要优于先前的一些基于类似性的经典算法.
3.疾病相关的miRNA预测
基于下面两个基本假设:(1)全局网络类似性测度比起传统的局部网络类似性测度可以更好的捕捉疾病和miRNA之间的内在关联;(2)功能相关的miRNA倾向于和表观性状类似的疾病相关.我们提出了一种新的方法,即基于可重启的随机游走预测miRNA与疾病关联方法(RandomWalkwithRestartforMiRNA-DiseaseAssociation(RWRMDA)).实验结果表明RWRMDA不仅可以在交叉验证测试中识别出被当做测试样本的已知的和疾病相关的miRNA,而且对于四种重要癌症(乳腺癌、结肠癌、肺癌和卵巢癌)预测出来的潜在相关的miRNA也大多得到相关数据库和文献的验证.
4.药物靶点作用预测
基于类似的药物调控类似的靶点蛋白这一假设和随机游走算法的框架,我们提出了在异质网络上进行基于网络的可重启的随机游走(Network-basedRandomWalkwithRestartontheHeterogeneousnetwork,NRWRH)方法,来大规模预测潜在的药物靶点作用.该方法结合三种不同的网络,通过已知的药物靶点关系的桥梁作用,构建了一个成分异质的网络并在这个网络上执行随机游走.NRWRH被分别用于关于酶(enzyme)、离子通道(ionchannel)、G蛋白偶联受体(GPCR)和核受体(nuclearreceptor)这四类重要的靶点蛋白的药物靶点作用预测.无论是在交叉验证模式下,还是在潜在药物作用预测并用相关数据库和文献验证模式下,NRWRH均显著改善了先前的算法的预测精度.
5.基于药物化学结构和靶点作用预测增效药物组合
基于增效药物组合的类似性原理,即类似辅药(主药)产生增效作用的主药(辅药)往往是类似的.结合已知的增效药物组合、未标签的药物组合、药物靶点作用和药物化学结构信息,我们提出了基于网络的拉普拉斯正则化最小二乘增效药物组合预测方法(Network-basedLaplacianregularizedLeastSquareSynergisticdrugcombinationpredictionmethod,NLLSS)预测潜在的增效药物组合.应用该算法于抗真菌增效药物组合预测,在交叉验证这一验证评价方式下,算法取得了非常好的效果.而且预测出来的十三对增效药物组合,有七对经过细胞生物实验得到了验证.