基于图论方法的蛋白质结构预测问题的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lizdy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构和功能预测是后基因组时代的重要研究内容,是人类揭示生命本质的基本问题。蛋白质结构预测问题是生命科学研究中的核心问题之一,同时需要数学、物理、化学、计算机科学、系统科学、控制科学等多学科的参与。本文就蛋白质结构预测的有关问题,进行了一些研究和探讨:  基于图的最大团方法的蛋白质loop结构预测。蛋白质的loop结构往往处在蛋白质序列的非保守区域,形状不同于规则的二级结构。但是loop区域的结构在蛋白质的功能中占有重要地位。目前,loop结构预测是蛋白质结构预测中的一个热点也是一个难点。利用氨基酸序列预测蛋白质结构,需要建立一个辨别函数,能够区别正确loop结构和不正确loop结构。本文对基于全原子的势能函数进行了改进,把寻找最小势能函数对应的loop结构问题转化为一个求赋权图的最大团问题,应用图的最大团算法,成功地预测到RMSD小于1(A)的loop结构。经过对loop结构诱捕(decoy)数据集进行检验,使Loop预测的准确性在4-9残基范围内有明显的提高。本文的研究结果为进一步研究蛋白质结构预测奠定了理论和实验基础,并扩展了图论方法的应用范围。  图的匹配方法预测蛋白质结构中的二硫键。在蛋白质结构预测的研究中,一个重要的问题就是正确预测二硫键的连接,二硫键的准确预测可以减少蛋白质构像的搜索空间,有利于蛋白质的3D结构的预测。本文将一个蛋白质结构中二硫键的预测问题,等价为一个寻找图的最大权的匹配问题。图的顶点表示序列中的半胱氨酸残基,边连接每一顶点,表示一种可能的连接方式,边的权根据一个权值函数赋值,用EJ算法寻找具有最大权的匹配,则这个匹配对应二硫键的正确连接。应用这个方法对蛋白质结构的二硫键进行了预测,比Piero方法略有提高,比SQL方法准确率提高了2.2%。  图的TSP问题与氨基酸参考秩序的研究。在蛋白质结构预测的研究中,已经分析了组成蛋白质的20个氨基酸的分子量之间的关系,并给出了一个氨质比公式和一个质参数集合,使20个氨基酸的分子量关系映射在一个[0,1]集合里,有利于数据的标准化。并且基于氨基酸的分类,提出了蛋白质参考链的概念,应用TSP算法,给出一个次序不变的参考链,并利用此参考链和质参数集合,提出了质秩距判别法,对蛋白质的二级结构进行了预测,取得了预期的效果,预测准确率达到78.92%。  基于图的最小Hamilton路模型的蛋白质结构预测的研究。研究蛋白质逆折叠问题是蛋白质结构预测的另一类方法,我们提出蛋白质结构的逆折叠的图的最小Hamilton路理论模型,并应用这个模型对loop结构进行实验,把loop的3D信息转化为一个加权完全图(Kn),然后求这个加权图(Kn)的最小Hamilton路。这条H路对应与寻找一个氨基酸残基序列,使该序列能够折叠成这个目标结构。根据基于统计的势能函数得到一个加权表,将加权Hamilton路问题的BT算法应用于loop结构取得成功。此模型的研究,对探索与尝试一种新方法来研究蛋白质逆折叠和预测蛋白质结构都具有重要的意义。
其他文献
列车驾驶模拟装置是一种由计算机实时控制,能正确模拟列车操纵,复现列车运行环境,用于培训和考核的仿真设备。依托于计算机视景仿真技术的列车视景仿真系统具有经济、安全、灵活
学位
在一维连续映射中,所有转变至混沌的临界点(累积点)上形成Feigenbaum型吸引子的分形维数D(及信息维数D)与标度因子之间存在着内在联系.对于具有m个转变点C1,C2,……,Cm的般m
当今社会环境污染和能源短缺问题日益凸显,电动汽车使用电能驱动,具有环境友好、能源转化率高等优点。车载充电机是电动汽车电源充电的核心部件,是限制电动汽车发展的因素之一。充电设备由电力电子器件集成,具有冲击性、非线性和不对称性,充电过程中易导致电网侧电能质量波动,对电气设备和电网负荷的正常运行造成较大干扰。因此,需要高质量的车载充电机来改善电动汽车充电过程中出现的上述问题,本文设计了一种高功率因数、低
学位
目前,随着风电、光伏发电等一批新能源产品的出现及全电电器、全电飞机等一系列军用和民用电器的发展,使得大功率接触器的需求量与日俱增,同时对其接触性能和电寿命也提出了更高的要求。考虑碰撞弹跳的接触器动态特性作为衡量其性能优劣的重要指标,成为目前研究的热点和难点问题。由于接触器本身所含机构零件较多,在其通断过程中,部件间多处存在碰撞接触现象,冲击碰撞问题本身具有的瞬时和非线性使得系统的运动状态变的更为复
研究人员针对表格填涂的问题进行了研究,旨在编写能在表格中方便进行文字填涂的软件.该软件实现的主要功能是在用户通过扫描仪输入原始表格,通过添加文本框的方式方便地进行
近些年,我国的社会经济水平不断发展和进步,各行各业的运作模式与过去相比都有了非常大的变化,建筑工程施工领域也不例外.与过去相比,当前建筑领域获得了非常大的成就,尤其是
随着我国城市化脚步不断加快,人们的生活水平也在不断提高,而且人们对于建筑质量的要求也越来越高.因此,不断完善建筑施工的技术,并且不断的完善质量方面的管理是非常重要的.
该文研究非等峰四符号动力系统和等峰四符号动力系统的星花积规则,以及星花积规则下的广义费根鲍姆度量普适常数,即标度因子α和收敛速率δ.在高度序关系条件下,研究人员首次
在人们日常生活和工作中,电力资源是一项非常重要且不能缺少的资源,良好的电力资源来源于正常稳定运行的电力系统,电力系统的稳定运行不仅可以满足人们的日常需求,而且还能够
分布式数据库管理(DisturbutedDataManagementSystem)的研究始于70年代中期.从理论上讲,DDBMS的总结性专著已有数部出发,从实践上,各种先驱计划均陆续完成,若干原形系统已投