【摘 要】
:
在后基因时代,蛋白质组学已逐渐取代基因组学成为生命医学研究的重点。如何根据蛋白质间的相互作用关系来系统的分析复杂的生命活动已成为当下的研究热点。尤其是在蛋白质网
论文部分内容阅读
在后基因时代,蛋白质组学已逐渐取代基因组学成为生命医学研究的重点。如何根据蛋白质间的相互作用关系来系统的分析复杂的生命活动已成为当下的研究热点。尤其是在蛋白质网络识别出蛋白质复合物,对预测蛋白功能、解释特定的生物过程具有重要意义。本文在分析蛋白质网络中功能模块的结构特征的基础上,根据传播理论的思想提出了有效识别蛋白质复合体的算法,主要研究工作包括:随着蛋白质相互作用数据的规模日益扩大,基于局部信息的蛋白质网络聚类算法越来越被研究者们所采纳。基于局部信息的蛋白质网络聚类算法,并不从网络全局的角度出发,而依据节点的局部信息,主要依据的是蛋白质网络中每个节点的局部邻居信息进行网络聚类,通常能在较短的时间内就能做到有效地聚类,更加适用于日益增长的蛋白质网络。针对以上问题提出了一种基于传播理论的蛋白质复合物识别算法GO-TSA。将网络中每个蛋白质节点看作一个信号源,每个节点通过相互作用关系互相传播信号,并且每一次的迭代传播过程中,根据邻居节点集合中的最强信号类型来更新自己。实验表明,算法能在很短的时间内对蛋白质网络进行聚类划分,在与CPM算法(k=3)和Core-Attachment算法进行对比实验表明,预测的蛋白质复合物不管是与已知蛋白质复合物的匹配程度还是从复合物功能富集性角度分析,GO-TSA算法均具有更好的识别性能。针对一个蛋白质可能从属多个蛋白质复合物的情况,在GO-TSA算法的基础上,提出了一种重叠复合物挖掘算法GO-OTSA,在该算法中引入了一个新的信号结构(c,b),一个信号类型是否被保留取决于其信号强度大小与最强信号的强度比值大小是否均衡。实验结果表明,GO-OTSA算法能够有效地识别彼此交叠的功能模块,并且算法的蛋白质复合物的识别性能,不管是与已知蛋白质复合物的匹配程度的角度分析还是从功能富集性的角度分析,都有一定的提升。
其他文献
虽然已经设计了很多不同类型的电子公文系统,有的已经投入使用,但是很多公认的问题一直没得到系统的解决,这些问题是:安全性问题、通用性问题、体系灵活性问题等等,其中安全
目前解决Web数据库技术问题的方案和产品越来越多.随着国内信息化技术的起步和发展,采用哪种技术,才能快速地建立起安全、高效、易于扩充的Web信息系统已成为企业与开发者密
数据的处理从以前的文件方式逐步发展到数据库处理的方式。数据库从开始的层次数据库、网状数据库逐步演化到关系型数据库。 在很多情况下,企业拥有大量的数据,却缺乏对这些数据的有效的处理和分析,更无法对决策分析提供信息。很多企业面临着以下问题:如何处理并利用好这些珍贵的资源,将其中蕴藏的信息转化为生产力?如何对复杂的动态环境做出及时响应并且能在大量的数据(包括历史的、当前的各种数据)中找到有用的信息
所谓移动代理(Mobile Agent),是指一种能够在网络上移动代表用户执行给定任务的应用程序,它的出现是动态网络和智能代理技术发展的结果,是现在业界的研究热点之一.作为一种新
该文研究了目前这一方面研究的发展现状,提出了通用的交互模型分析工具IMAA和交互过程分析工具IPAA两个模型.在这两种新的模型下,用户可以借助于以往分析工具的组合的特性和
国内许多行业如冶金、医药、水泥等行业都对各种原材料有贮存及配料要求,也建立了一些数学模型来解决生产中有关配料方面的问题,也有很多行业如港口、铁路、仓储行业对于原料的
众所周知,Web应用是典型的浏览器/服务器(简称B/S,下同)架构的产物,B/S架构以其轻量级、易用性强、使用灵活等优点已经逐渐成为主流的应用程序架构,但是Web应用开发领域也面临着许
该文研究嵌入式系统的软硬件划分和综合的技术.提出了一种基于并行语言PL的协同设计方法.着重介绍了基于PL的软硬件划分方法,软硬件协同综合技术.PL的形式化语义为软硬件划分
为了适应国内Web网站占绝大多数的现状,我们工作的主要目的在于,使呼叫中心无需重新建立一个WAP网站,移动终端可以直接访问呼叫中心的已经建立的Web网站,以减少重复建设,我们