【摘 要】
:
本论文的主要目的在于介绍蛋白质信号肽的特征和性质,并在此基础上利用数学方法对信号肽和信号肽的剪切位点进行讨论和预测。文章中介绍了国际上公认为比较便捷而且准确率比
论文部分内容阅读
本论文的主要目的在于介绍蛋白质信号肽的特征和性质,并在此基础上利用数学方法对信号肽和信号肽的剪切位点进行讨论和预测。文章中介绍了国际上公认为比较便捷而且准确率比较高的几种方法,并在此基础上提出信息论方法在蛋白质信号肽方面的应用。本论文使用的数据库是瑞典CBS(Center for Biological Sequence Analysis)的Nielsen等根据SWISS-PORT version 29构建的二次数据库,所有的数据库都进行了同源性消减:此数据库中将包含1383个非同源信号肽序列和519个成熟蛋白序列。在此基础上,对N端信号肽进行了统计学分析,以充分说明真核生物以及原核生物(包括革兰氏阳性菌和革兰氏阴性菌)的信号肽特征,并验证(-1,-3)原则的准确性和普适性。在利用信息论方法讨论蛋白质信号肽的性质和特征的时候,首先利用自信息量概念,对数据库中的信号肽和成熟蛋白质进行处理,计算得出两者的自信息量值进行比较,发现成熟蛋白平均的信息量随窗口变化波动不大,而且整体高于信号肽的信息量;信号肽的平均信息量整体较低,且随窗口的变化有剧烈地波动,这也暗示着我们可以利用这种思路对信号肽的剪切位点进行预测。然后,利用信息熵的概念,将信号肽的每一个位置看作一个单独的信源,计算出各个位置的熵值,发现对真核生物来说,其信息熵在-1和-3位只有两个明显的谷,表明相对与邻近位置,-1及-3更具特征,而-12~-8位置又对应一个极值区,这说明h区相对于c区和n区更具特征。对于革兰式阴性菌及革兰式阳性菌来说,它们在-1位置与-3位置的特征性更强,这说明,在此数据库下,原核生物比真核生物更符合(-3,-1)规则。而在h区则没有明显的谷,也说明原核生物信号肽h区特征较小。最后,引入简单信息矩阵的概念,并用来预测和检验蛋白质信号肽剪切位点。对于它检验,真核生物、革兰氏阳性菌和革兰氏阴性菌的预测准确性分别达到60.1%,69.2%,81.2%。简单信息矩阵对原核生物的预测能力要好于权重矩阵方法,但对真核生物的预测能力却略逊于权重矩阵方法。
其他文献
目的通过对胆碱能抗炎通路标志性蛋白IκB、p-IkB、NF-κBp65在急性肺损伤(acute lung injury,ALI)小鼠模型中的表达变化及小鼠生存率的研究,探索该通路是否对ALI有保护作用
通过Piper三线图示法、系统聚类等方法对玛纳斯河中下游28个地表水样品离子化学成分进行了分析,研究了玛纳斯河流域冲积平原的水化学分布特征及影响因素。结果表明:1)研究区
近年来,企业面临不断的客户需求,新产品开发日益成为企业成功经营的核心。企业是否具备快速、高质量、低成本地推出产品的能力,已成为决定企业成败与否的关键。烽火集团是我
智能公交预报站系统可以结合先进的通信技术、全球定位技术与地理信息技术等,并结合公交车辆运动特征的分析,对公交车辆的大致到站时间进行预测,达到对公交车辆实时的有效调度管控,从而提高公交系统的运行效率,降低维护的成本。而我国大部分地区的公交智能预报站系统仍然较为落后,车辆的到站预报信息准确性较低、实时性较差,严重影响了公交系统的运行效率,影响人们的日常生活,给出行带来了极大的不便。如何提高预报的准确性
针对机器人非标定全局定位问题,研究Kalman滤波(Kalman filtering,KF)算法联合反馈型Elman神经网络(Elman neural network,ENN)学习机器人图像空间与运动空间非线性映射关系,
针对近期开通的客运专线在联调联试过程中发现自动过分相存在两次断合VCB(真空断路器)的异常问题,通过对车载设备的记录数据及地面自动过分相装置的设置情况进行分析,找到两次断
在不停航、快速施工等条件下,沥青加铺层已被有效地应用于机场道面的建设中,使得复合式结构道面的使用日益广泛。鉴于大型飞机产生的荷载作用以及外界环境因素与内部材料特性
目的:了解维持性血液透析(MHD)人群抗丙型肝炎病毒(HCV)抗体和HCV-RNA的阳性率,探讨其丙型肝炎病毒(HCV)感染的发生率、危险因素、血清转氨酶水平的变化。方法:选择苏北3个血
双向搅拌复合高强混凝土芯桩是一种随着水泥土搅拌桩施工技术的日趋成熟而提出的新型复合桩型。此复合桩与传统的复合桩的不同点在于外芯—水泥土搅拌桩施工工艺的改良。目前
比较了4个姬松茸(Agaricus blazei)品种在子实体形态、生物学效率、营养物质含量和镉含量等方面的差异,姬-3号和姬-4号子实体中不含半胱氨酸和甲硫氨酸,且镉含量相对较低;姬-3