基于蛋白质相互作用网络的聚类和稀疏点检测算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:QQ379043463
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组测序的完成,对蛋白质结构和功能的研究成为基因组学研究的一大热点。研究证明,蛋白质在其功能组中很少以单个个体而存在,一般与功能相似的蛋白质之间存在相互作用。因此,我们可以通过对蛋白质相互作用(Protein-Protein interaction,PPI)网络的研究来预测其功能。本文将在基于PPI网络的聚类及稀疏点检测算法两方面进行研究:提出一种蛋白质功能预测算法——基于算术平均最小值(the Arithmetic Ave- rage Minimum Value, AAMV)的K-means聚类算法。首先,根据蛋白质之间的相互作用,通过人类AD(Alzheimer’s Disease)相关PPI网络图,得出蛋白质之间的关联矩阵;然后,利用AAMV法求得相似度矩阵;接着,鉴于误差平方和准则不能较好的对聚类进行收敛,提出了加权的误差平方和准则;最后,在相似度矩阵的基础上,利用加权的误差平方和准则进行有效收敛,利用K-means聚类方法对PPI网络中的蛋白质进行聚类与功能预测。提出PPI网络中的稀疏点检测算法——基于加权的相似系数和算法。首先,根据蛋白质之间的相互作用,通过人类AD(Alzheimer’s Disease)相关PPI网络图,得出蛋白质之间的关联矩阵;然后,利用最大最小值法求得相似系数矩阵;接着,由于相似系数和不能对PPI网络中的稀疏点进行更好的检测,因此,在相似系数的基础上提出加权的相似系数和方法。最后,根据输入的阈值,利用相似系数和算法得出PPI网络中的稀疏蛋白质。基于人类AD相关PPI网络图,利用基于AAMV的K-means算法对图中蛋白质进行聚类,其结果与Maryland Bridge法和Korbel法所得结果非常相似;利用聚类结果,对四个孤立蛋白质的功能进行预测。同时,利用加权的相似系数和算法对图中的稀疏蛋白质进行检测,实验结果表明:输入的阈值取值在0.01-0.16之间时,其精确度比较高。
其他文献
最近几年,本体被广泛的应用在知识共享、融合与集成等领域中。但随着本体数量爆炸式地增长,不可避免地出现大量描述相同领域的本体各自独立地发展,对于同一个领域可能存在多
对等网络(P2P)技术突破了传统服务器/客户机模式,已经越来越受人们青睐。互联网上基于P2P技术的应用也越来越多,涉及即时通信、数据共享、海量存储、协同计算等多个领域。然
随着Internet的普及和多媒体技术的发展,多媒体信息的安全及版权问题引起了越来越多人的关注,数字水印技术应运而生。鉴于小波技术发展的日趋成熟以及小波变换具有与人类视觉
光栅投影是目前使用最为广泛的一种三维形貌测量技术,在工业检测、质量控制、逆向设计、医学、虚拟现实、文物数字化和人体测量等众多领域具有广泛的应用前景。因为其原理简
网络自身安全机制的脆弱性、现有网络安全产品的局限性、以及各种网络恶意活动的日益猖獗导致了网络安全形势不容乐观。网络安全态势感知系统(Network Security Situational
粗糙集理论是一种处理含糊和不确定性信息的新型数学工具,其理论提出以来得到迅速的发展和广泛的应用。知识约简是粗糙集理论重要研究内容之一,它的主要目的在于去除数据中的
嵌入式系统地广泛应用使得嵌入式系统互连网络成为一种必然。但是由于嵌入式网络的异构性、异质性和对等性等特点,嵌入式的互连不能直接使用传统的网络协议。因此构建一种能
在临床医学领域中,超声彩色血流成像(CFI)因其经济适用、无侵入、无损伤、对人体影响小并且能够准确得到待测剖面的二维血流速度分布,是诊断心血管疾病的重要技术。随着国家
近年来伴随着对约束数据库理论和应用技术的大量研究,数据库上的约束问题逐渐成为新的关注点和热点。随着关系数据库使用的不断深入,在关系数据模型中除几种基本的完整性约束
随着Internet和电子商务的发展,现代企业业务越来越复杂,业务重组及跨平台等问题给工作流管理系统的发展带来更大的机遇和挑战。目前工作流管理系统大都基于静态过程定义,而