基于基因本体论的蛋白质网络模块识别算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wenzhiqiang963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
识别蛋白质相互作用网络中的模块结构,是理解细胞功能的组织结构以及动态性的第一步。因而,如何在蛋白质相互作用网络中寻找模块结构便成为一项十分重要而且极具挑战的任务。目前,出现了许多基于蛋白质相互作用网络的拓扑结构识别模块的方法,但是这类方法主要集中于识别网络中的稠密区域作为蛋白质模块,而忽略了蛋白质自身所具有的生物功能。因此,在本文中,我们提出了一种既考虑蛋白质相互作用网络的拓扑结构,又考虑蛋白质自身生物功能的基于基因本体论的模块识别算法(Core-Attachment based on Gene Ontology,CoAchGO)。CoAchGO算法主要包括两个步骤:首先,在蛋白质相互作用网络中找出蛋白质模块的核心(称之为蛋白质核)。在找蛋白质核的过程中,利用基因本体论从蛋白质分子功能层面对蛋白质核进行校正与过滤。这样既弥补了单一依据拓扑性的不足,又能有效地处理目前蛋白质相互作用网络中普遍存在假阳性、假阴性数据的问题。接着,再利用基因本体论对蛋白质核进行扩展,将那些倾向于辅助蛋白质核完成生物功能的附属蛋白质包含进来,形成最终的蛋白质模块。在酵母蛋白质网络上,利用标准蛋白质模块集、基因本体论和位置注解等对算法进行性能评估,并与几个具有代表性的算法进行比较。实验结果表明,得到的蛋白质模块在查全率、查准率,尤其在生物意义方面好于现有算法。
其他文献
三支决策理论(3WD)由三种决策规则组成,分别是接受决策、拒绝决策和不承诺决策。在传统的二支决策的基础上,三支决策增加了一个不承诺决策选项,即表示人们可以在信息不充分的
门限代理重签名不仅能防止代理者签名权利过分集中而被滥用,还可保证重签名密钥的安全性和完整性。目前,门限代理重签名方案大多是基于证书或者基于身份的,不可避免的存在密钥托
随着信息技术的不断进步,现实领域产生了海量的数据。传统简单的分类器无法对海量数据准确地进行分类,而已有的研究表明,集成学习方法是一种有效的解决海量数据分类的方法。
数字签名作为密码学的一个重要分支已经被广泛应用于提供安全的电子通信。数字签名具有身份认证、不可否认和数据的完整性等特质适合解决某些任务的安全问题,例如电子交易系
近年来,随着网络通信的快速发展和无线通信技术的逐步成熟,手机、PDA、数码相机等微型化便携设备以其在不经PC中转的情况下就可以进行互联、通信的优势迅速普及。与此同时,车辆
随着对流聚类研究的深入,许多研究者提出了对不确定数据流的聚类,这是由于生活中不确定数据存在着重要的应用价值。不确定数据流既保留数据流无限,快速的特性,又存在不确定特性,这
近几年国内外学者已经对手部多特征融合识别技术做了大量的研究,主要包括掌纹和手型融合识别,指纹、掌纹和手型融合识别,手背静脉和指关节融合识别,指静脉和指背部融合识别,
随着数字媒体技术和社交网络的发展与普及,越来越多的网络信息以包含多种模态数据的多媒体文档的形式出现。传统的文档检索已经不能满足人们的需求,如何有效的从这些海量多媒体
学位
2000年,R. Ahlswede等人提出了网络编码的概念,它完全颠覆了传统的路由方式。网络编码技术允许网络节点对接收到的数据信息进行编码处理,然后将编码数据包发送出去;接收端根