蛋白质序列的特征提取及相似性研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:jonquil1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对蛋白质数据日益海量增长这一趋势,应用生物信息学技术辅助预测蛋白质结构与功能已经成为了一项重要任务。本文利用统计学方法和机器学习方法,研究蛋白质序列的纹理特征及相似性,使用智能算法辅助预测了蛋白质结构类型,对低分泌蛋白质的原始信号肽序列进行了人工优化设计。在第二章中,提出了一种新的蛋白质特征向量构造方法,利用马尔可夫过程将蛋白质序列转换为马尔可夫转移频次矩阵,然后计算其对比度、同质性、相关性和能量四个特征值,并结合Chou提出的伪氨基酸组成理论构造新的蛋白质特征向量,然后将新的蛋白质特征向量构造方法用于真核细胞(Eukaryotes)、革兰氏阳性真菌(Gram+bacteria)和革兰氏阴性真菌(Gram-bacteria)三类物种蛋白质的分类,分类结果表明使用新的方法构造的蛋白质特征向量能够表征蛋白质的特性。在第三章中,鉴于识别蛋白质二级结构对于进一步研究蛋白质的特征和性质具有重要的作用,提出一种新的基于双树复小波变换识别蛋白质的方法。首先利用Cα原子三维空间坐标把蛋白质序列映射为距离矩阵,然后针对距离矩阵中隐含的纹理信息,使用双树复小波变换对矩阵进行四级分解,提取不同方向的子带能量和标准偏差,得到了48维特征向量来表示蛋白质的二级结构特征,最后结合机器学习算法实现了对四种不同结构类蛋白的区分。在第四章中,鉴于生物体中许多天然蛋白质的分泌量较低,难以进行大量的提取和生产,利用三种策略对原始信号肽序列优化改造,分别在原信号肽序列基础上替换氨基酸,插入氨基酸和删除氨基酸,再根据氨基酸的不同物理和化学性质构建人工信号肽序列片段三维坐标的伪骨架距离矩阵,最后利用逐行DTW算法计算人工信号肽的相似性,从而实现对信号肽序列进行人工优化设计。
其他文献
乳酸乳球菌乳酸亚种是乳品工业中常用的发酵剂菌种之一。研究表明乳酸乳球菌乳酸亚种环境区位的多元化可能赋予菌株在乳制品之外体系的应用潜力,但迄今为止的研究多聚焦于分离自乳体系的菌株,尚需要对来自其他分离源的乳酸乳球菌乳酸亚种菌株的基因组特征、发酵特性等进行研究;挖掘乳酸乳球菌乳酸亚种内的亚群规律以及发酵过程中物质转化和代谢规律。本研究对75株乳酸乳球菌基因组进行了平均核苷酸同源性分析、同源基因分析及泛
磷酸镁是一类重要的生物材料,在生物医学领域中具有广泛应用。磷酸镁的水合作用对其形成和应用具有重要意义,而水分子(H2O)在镁离子(Mg2+)和磷酸根离子的影响下可能具有的电化学氧化活性及应用尚未有研究。本文对磷酸镁形成过程及其水合过程中的电化学行为进行了探索,并基于其结合H2O的电化学氧化特性构建了对磷酸根离子的检测平台。主要研究结果如下:(1)在pH 7.4的条件下,母液中初始镁源越多越有利于M
糙米因其健康益处而受到广泛关注,但蒸煮糙米饭口感不佳。蒸煮程序参数与米饭蒸煮品质密切相关。如何通过蒸煮程序调整改善其食味品质,成为糙米饭推广食用的关键,然而相关方面鲜有报道。为此,本课题利用可调程序的电饭煲和可调压力的电压力饭煲,研究不同浸泡条件和压力条件的蒸煮程序对糙米饭食味品质和营养价值的影响,探究糙米饭属性与质构特性的关系。本课题旨在为优化糙米饭蒸煮程序和提高糙米饭蒸煮品质提供信息。主要研究
手性是一种在自然界中普遍存在的性质。手性光学特性主要包括非对称传输、圆二色性和旋光性,但是天然手性材料中的光学特性并不明显。因此使用人工集成的手性超材料来获得这些光学特性已经成为一种趋势,在此基础上制备而成的光吸收器、传感器、偏振器也备受关注。石墨烯超表面是一种二维的超材料,拥有优秀的物理性质、光电性质,以及动态可调的电导率。本论文利用石墨烯材料的可调谐性,基于有限元数值分析方法分别对实现不同光学
氧化型辅酶Ⅰ,即烟酰胺腺嘌呤二核苷酸(Nicotinamide Adenine Dinucleotide,简称NAD+)是参与许多生理过程的必需辅酶。近年来,随着绿色生物技术的发展,NAD+在生物催化领域以及医药行业已经显示出其巨大的应用价值。尽管目前已经开发出构建NAD+高产菌株的生物技术,但是其低生产率仍然阻碍了其大规模的应用。本文利用分子生物学技术对大肠杆菌BL21(DE3)胞内NAD+含量
石墨烯量子点是尺寸小于10 nm的零维碳材料,具有独特的光学、电学性质,被广泛用于光学传感、电化学发光传感、电化学传感、生物成像、催化、抗菌等领域。目前石墨烯量子点存在功能单一、催化活性低、单波长发射、荧光强度弱等局限。因此,设计并制备出具有良好荧光性质和功能的石墨烯量子点显得尤为重要。本论文采用引入功能基团和功能组分两种途径对石墨烯量子点进行功能化,制备出了丝氨酸功能化石墨烯量子点、丝氨酸和组氨
亲和层析技术是对重组蛋白分离纯化的有效手段之一,具有易操作、纯化效率高等特点,但是亲和层析技术通常需要在目的蛋白中引入特殊的亲和标签。工业上常用的去标签手段有内切酶法、化学法等,但处理手段往往耗时耗力且十分昂贵。内含肽作为一种特殊的蛋白质,包含了IN、IC两个互不连续的蛋白片段。内含肽通过一系列重排、转酯、环化等自我催化的反应过程,可以从前体蛋白中切除并将两端的蛋白多肽链(蛋白质外显肽,Extei
来源于粉红螺旋聚孢霉Clonostachys rosea的玉米赤霉烯酮水解酶(ZHD101)可以有效降解谷物农副产品和饲料中的霉菌毒素玉米赤霉烯酮(Zearalenone,ZEN),然而天然酶固有的低热稳定性限制了其应用潜力。传统的定向进化可以对蛋白质的特定性质进行提升,但是建立和筛选突变文库所需的工作量较大。随着结构生物学,计算生物学以及计算机技术的快速发展,不断有先进的蛋白质改造相关算法涌现,
三维荧光光谱技术(Three Dimensional Fluorescence Spectrometry,TDFS;又称Excitation-Emission Matrix,EEM)通过生物样品中荧光分子特征信息表征生物分子间动力学特性、获取蛋白质有效光谱信息。该技术样品预处理简单,快速灵敏,具有较高的应用价值。本研究以实验室前期工作获得的一种以黄素腺嘌呤二核苷酸(FAD)为辅酶的肌氨酸氧化酶(S
用于相互作用检测的高通量生物实验方法的技术进步导致了蛋白质相互作用数据的爆炸式增长,这些数据对不同物种间的生物关系分析将具有重要意义。蛋白质相互作用数据往往被抽象为一个网络,网络比对算法则是进行网络数据分析的重要工具,通过对两个不同物种进行网络比对,将有助于理解细胞组织,发现物种间的进化保守关系和个体差异,从而有助于进行疾病分析、新药靶点治疗和为物种间的注释转移提供重要信息等。目前从实验中提取的蛋