基于神经网络的蛋白质折叠速率预测

来源 :山东理工大学 | 被引量 : 3次 | 上传用户:bingke111888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是一类最重要的生物大分子,在生物体内占有特殊的地位.蛋白质折叠是蛋白分子从它的变性状态到达其具有生物活性的天然构象的过程,在这一过程中,不同的蛋白质其折叠速率有着很大的差异. 为了揭示蛋白质折叠速率的决定因素,许多工作者开展了大量的研究工作.迄今已提出许多基于结构的经验参数,接触序、长程序、二级结构含量、有效长度等,基于这些参数的各种预测方法所得到的预测结果也与实验数据有着较好的吻合. 然而上述许多方法都需要预先知道蛋白质的结构特性,或预测出其结构特征,再进行折叠速率预测.为了避免这些因素产生的影响,我们提出了一个直接从蛋白质的氨基酸序列出发,不需要任何结构信息,用人工神经网络方法预测其折叠速率的模型.首先将收集到的蛋白质氨基酸序列按其生物学特征数字化,如按氨基酸在螺旋构象中的平均自由能、氨基酸的出现频率等特征对氨基酸赋值,获得与一级序列相应的数字化序列;其次利用现代数字信号处理方法中的小波分析技术进行数据边界处理,如对称延拓、零延拓、平滑延拓等方法,然后用高斯函数根据滑动窗口法对数字化序列进行压缩以满足模型的需要;最后利用 Matlab 中的神经网络工具箱建立一个三层BP网络模型进行折叠速率预测.用 jackknife 方法进行检验,相关系数可达0.635,与以前方法的结果相吻合.该模型的建立为本领域的发展开辟了一个新的研究思路.
其他文献
在植物和动物基因组中,转录因子通过识别特殊的序列,并通过与这些序列结合起到调控基因表达的作用。“GAGA Factor”是一类能识别、结合(GA)n二核苷酸重复序列,继而改变染色质结构并起到调控下游基因表达的转录因子蛋白,我们将这类特殊(GA)n二核苷酸重复序列称为“GAGA Element”。目前,在植物基因组研究中,仅有为数不多的有关GAGA Factor蛋白功能的报道。随着水稻全基因组测序计
本文主要通过研究中国冰岛蓼属花粉,花被片,果实,叶,茎等微形态特征,重新探讨了广义冰岛蓼属Koenigia L.是否成立及其物种范围与物种界定问题。并对《中国植物志》(李安仁,19
红霉素(erythromycin,Er)是由革兰氏阳性细菌糖多孢红霉菌(Saccharopolyspora erythraea)合成的次生代谢产物,为一类大环内酯类抗生素,包括红霉素A(ErA)、红霉素B(ErB)、红霉
目的:通过重组人粒细胞集落刺激因子(rhG-CSF)的PEG修饰、分离纯化获得单修饰的PEG-rhG-CSF,并进行药理学研究。  方法:用单甲氧基聚乙二醇活性酯(mPEG20k-NHS)对rhG-CSF进
本文运用细胞培养、流式细胞分析、放射性免疫分析、酶联免疫吸附实验等免疫学和细胞学技术,综合研究和观察了hsBAFF对小鼠T淋巴细胞的免疫功能活性及其分泌细胞因子的变化,T淋
随着互联网和智能手机的发展普及,催生了手机APP这一新事物,商家企业也纷纷注意到手机APP的广告投放功效,他们正在不断寻求有效的、大批量的网上宣传平台,而校园APP的广告植
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
背景与目的:人口老龄化是全世界面临的一大难题,根据世界卫生组织发布的最新统计数据,到2050年,全球60岁以上人口比例将从2006年的约11%增至22%。而我国截止到2003年60岁以上的
好多年没有回老家孟庄了。其实我城里的家离老家也不过几十里路程。孟庄是豫东平原一个普通的小村庄,绿树和小河环抱着她,村外是一眼望不到头的田野。莫名的,常常会很怀念孟
本文以胶州湾以及周边海域作为研究区域,于2003年对黄海沿岸临近胶州湾海域的小青岛站位开展了浮游植物群集的周年调查并收集了2003-2004年胶州湾内浮游植物群落数据和胶州湾