论文部分内容阅读
蛋白质是生命活动的载体,其只有在折叠的状态下才能表现出生命的功能,因此蛋白质折叠结构要比其氨基酸序列保守,并且与生物功能密切相关。一般来说,具有相似结构的蛋白质,其功能有可能相似,因此计算蛋白质问的结构相似性是结构生物学中的一个重要问题,在蛋白质折叠结构分类、蛋白质折叠功能推断、蛋白质结构预测和模拟、结构模体的发现、以及序列、结构与功能之间的进化关系、蛋白质相互作用等研究中有重要应用。蛋白质相互作用是信号传导网络和代谢网络的载体,而蛋白质相互作用界面又是蛋白质相互作用产生的物理载体,因此从残基水平来研究蛋白质相互作用对于理解各种生物过程是非常重要的。生物实验表明相互作用界面上残基的结合能量不是均匀分布的,只有一小部分的残基对于蛋白质的结合起非常重要的作用,叫做热点。本论文利用优化模型来考虑蛋白间的结构相似性,包括蛋白质两结构相似性、蛋白质多结构相似性和蛋白质相互作用界面的相似性。主要内容有以下几个部分:
■首先简要介绍了蛋白质结构生物学中的一些预测蛋白质结构、预测蛋白质表面关键残基(配体、DNA、RNA结合位点,蛋白质.蛋白质相互作用位点)、预测蛋白质相互作用界面的热点、和预测蛋白质相互作用的方法,重点介绍了有关蛋白质结构间相似性研究的已有方法,包括蛋白质两结构比对方法、蛋白质多结构比对方法、蛋白质结构数据库搜索方法、配体结合位点比对方法等。
■然后给出了一个结合动态规划、网络和多目标优化模型的两结构比对方法SANA,该方法可以得到准确的保持序列顺序的比对结果;进一步,对SANA用比对上的残基数作为两个蛋白质链平均长度的百分比来衡量两个蛋白质的结构相似度,发现其可以得到较好的结构分类结果;另外,作为一个重要的特点,SANA可以输出序列顺序无关的比对结果,这对研究进化过程中距离较远的蛋白质具有重要的作用,例如发现圆扰动的蛋白质和找出保守的功能位点。圆扰动是蛋白质结构在进化过程中氨基端和羧基端转移到另一个蛋白质不同部分的现象。圆扰动现象的蛋白质具有拓扑无关的结构相似性,即相似性片段不保持蛋白质的氨基酸序列顺序。
■接着给出基于混合整数规划模型的蛋白质多结构比对方法SANA-mult,该方法在保持序列顺序时对于Homstrad里的蛋白质族可以得到正确的比对结果;进一步,算法的序列顺序无关比对方式对于圆扰动相关的蛋白质族,可以很好地找出其结构相似性和保守的功能位点来。
■最后我们给出了基于整数二次规划模型的方法RNAlign来考虑蛋白质相互作用界面的比对问题,该方法整合了蛋白质序列的进化信息、结构信息,并用进化谱的相似性来对比对上的残基打分以衡量其进化保守性;通过计算实验,发现进化上和结构上保守的残基极有可能就是对于蛋白质结合起重要作用的残基,即热点。