高尔基体蛋白定位预测研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:guiminzhu18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
了解一种蛋白质所位于的亚细胞位置是了解其生物学功能的一个重要的步骤。高尔基体作为真核细胞中常见的细胞器和一些重要的疾病有着紧密的联系,比如:奥兹海默症以及帕金森症。了解了高尔基体蛋白的功能将会对治愈这两种疾病有着重要的意义。在本篇论文中,我们对于高尔基体蛋白定位预测进行了系统的分析。首先,我们提出了一种方法,用于确定一种蛋白质是否为植物细胞中的Golgi-resident蛋白。这种方法使用了创新形式的Chou提出的伪氨基酸序列构成方法,并融合了跨膜域信息以及多种不同的氨基酸物化特性。基于使用支持向量机分类方法,我们的方法在5折交叉验证实验中,取得了超过90%的预测效果,优于目前存在的同类方法。确定了一个蛋白质是不是Golgi-resident蛋白是远远不够的,需要进一步确定其具体类型。了解Golgi-resident蛋白的类型对于理解其生物学意义上的分子功能起着关键的作用。Golgi-resident蛋白主要分为两大类:cis-Golgi蛋白以及trans-Golgi蛋白。不同类型的Golgi-resident蛋白起着不同的作用。因此,我们在此基础上提出了一种基于支持向量机算法的分类器,并结合了蛋白质的位置特异性物化特性以及基于互信息理论的特征选择算法。在留一交叉验证实验中,我们的方法仅仅使用了49维特征便取得了91.24%的预测准确率。为了检验我们的性能,同时避免过拟合现象的发生,我们还与其他现存方法进行了全面的比较。得到的结果显示,我们的方法优于目前就我们所知的全部同类算法,且具有最少的特征数量。此外,我们还对不同的特征选择算法在此类问题上的应用表现进行了分析。实验结果表明,我们提出的方法对于高尔基体蛋白的位置预测十分有效而且具有预测多种蛋白质属性的潜力。在本篇论文中,我们旨在全面系统地对高尔基体蛋白质进行分析。算法的两个步骤为:首先确定一种蛋白质是否为Golgi-resident蛋白,进而判断Golgi-resident蛋白的具体类型,是停留在cis-Golgi网络或是trans-Golgi网络中。实验结果证明,我们的方法是目前同类别算法中表现最好的,并且特征向量维度最少。
其他文献
实际工程中采用框支短肢剪力墙结构,难免会出现转换梁跨中抬短肢墙的情况。因此,本文立足于钟树生团队对此类子结构研究的基础上,通过ABAQUS有限元分析软件对框支短肢剪力墙
经典流体润滑力学都是基于无滑移边界假设,但随着微纳米测试技术的飞速发展,发现微纳米尺度下的边界滑移不可忽略。车辆传动系统中的齿轮、蜗轮蜗杆、凸轮、轴承、泵、马达以
本文研究利用波长为532nm绿光打印于硅晶片表面的字体的研究。倒装芯片封装是当前最先进的一种封装方式,而裸芯片封装正是基于倒装芯片封装的一种方式,即芯片直接裸露在外而
在全球化、信息化和市场化三大时代潮流的背景下,国际竞争非常激烈,而国际竞争的实质就是国家之间各产业的竞争。如何有效地提高产业的竞争力是每个国家所关注的焦点。如今,随着开放式创新在企业层面的研究和实践应用不断结出硕果,开放式创新能够显著影响企业创新绩效已成为不争的事实。然而,现有研究对开放式创新如何影响产业,对开放式创新是否能够提高产业创新产出的关注较少。故本文旨在厘清开放式创新和产业创新产出之间的
神经精神类疾病一直都是困扰人们的一大难题,在人们对治疗方法的不断探索中,其治疗手段也在逐步发展。近年来发现,无创式脑调制技术对诊断和治疗神经性疾病有重要的作用,其采
直接乙醇燃料电池直接是以乙醇为燃料,将其化学能转化为电能的装置,其比能量高,环境污染小,是一种高效绿色的能源技术。同时,乙醇来源广泛,生产工艺成熟,无毒无害且易于存储
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术能大幅提升频谱利用率与传输速率,同时还能有效对抗多径时延扩展以及频率选择性衰落。但作为一种多载波
统计矩的点估计法是随机系统分析的简便且有效的方法之一,具有原理简洁清晰、操作简单易行的优点。计算精度、计算效率是评价点估计法优劣的两个主要指标。本文拟以系统的高
作为国家和区域经济发达程度、科技水平以及综合实力的体现,汽车工业在全球经济发展和社会进步中扮演着至关重要的角色。美国、欧洲和日本是全球汽车生产制造行业的三大集团
人类大脑是已知宇宙中最复杂的结构,它由数十亿的神经元和百万亿的突触连接构成,现有的科学研究已经证实脑部是一个产生意识、思想和情感的器官。人脑由多个组织构成,这些不