论文部分内容阅读
本论文旨在提出一种新的蛋白质相似性定义,进而对蛋白质相互作用网络进行模块化聚类。为了更合理的定义相似性,本文首先获取了多个物种的蛋白质-蛋白质相互作用数据,分别统计了每个物种蛋白对数在二阶和三阶相互作用路径数上的分布,并和随机情况作比较。发现二阶相互作用情况下的分布相对随机分布有明显偏移,而三阶情况下的分布则趋向随机。这说明在蛋白质相互作用网络中,二阶相互作用具有生物意义,能够体现蛋白之间的相似性,三阶相互作用对蛋白之间的关系影响不大。根据这个结论,我们提出了一种新的相似性定义,该相似性中的系数可根据不同模式生物进行调节,使其具有物种针对性。最后我们根据该相似性的定义,通过模糊聚类方法对酵母蛋白质相互作用网络进行了聚类,评估结果显示聚类效果好。