蛋白质翻译后修饰鉴定软件InsPecT的并行及优化研究

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户：df0225

【摘要】

：

随着人类基因组计划的完成，蛋白质组学受到了越来越多关注。其中对蛋白质翻译后修饰的研究是一个重要的分支，而对翻译后修饰进行鉴定是研究的首要任务。　　串联质谱技术是鉴

【作者】

：

涂强

【机构】

：

中国科学院计算机网络信息中心

【出处】

：

中国科学院计算机网络信息中心

【发表日期】

：

2009年期

【关键词】

：

生物信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人类基因组计划的完成，蛋白质组学受到了越来越多关注。其中对蛋白质翻译后修饰的研究是一个重要的分支，而对翻译后修饰进行鉴定是研究的首要任务。　　串联质谱技术是鉴定蛋白质翻译后修饰的主要方法，目前已经有很多根据质谱数据进行蛋白质翻译后修饰鉴定的软件。其中，InsPecT由于采用了先进的盲搜索算法MS-Alignment，在鉴定蛋白质翻译后修饰时具有其他软件无法比拟的优势，但该软件的时间复杂度很高，无法满足用户的实际需求。本文以中国科学院上海生命科学院正在使用的软件InsPecT作为研究对象，把对其进行并行优化作为研究的重点，最终目标是让并行软件满足用户计算速度与鉴定精度的需求。　　论文对InsPecT的大规模计算进行并行处理，有效减少了计算时耗；同时，提出蛋白质数据库索引预处理方案，提升软件计算精度。主要的创新工作包括以下两个方面：　　 (1)InsPecT的并行化实现。　　在实际质谱鉴定实验中，质谱数据条数达到百万量级，蛋白质数据库中的序列达到上万量级，且计算中每条序列时都需要考察各残基位点是否发生突变，这样庞大的迭代次数非常耗时，串行程序无法及时完成计算任务。基于上海生科院的应用需求，本文针对InsPecT实现了可扩展性较好的并行优化版本。为了保证负载平衡，本文尝试了对等与主从两种并行模式，通过比较最终采用了动态分配任务的主从模式。　　 (2)通过建立数据库索引文件对InsPecT进行优化。　　在对InsPecT软件进行研究的过程中，我们发现源程序中包含了大量的重复计算；此外，源程序编写中以牺牲鉴定精度来换取时间复杂度和空间复杂度的降低。其结果导致算法精度的降低，但计算复杂度依然较高。本文通过建立蛋白质数据库索引文件进行预处理，一方面减少了重复计算时间，另一方面提高了算法的鉴定精度。

其他文献

M2M业务支撑平台WEB管理系统的设计与实现

网络技术飞速发展，随之而来的网络增值业务也不断涌现。然而，这些增值业务所采用的开发标准与规范往往不尽相同。这样的结果是导致网络增值业务种类繁多，fH是却没有统一的接口标

学位

网络增值业务网络增值业务M2M支撑平台M2M支撑平台系统设计系统设计

基于海量互联网网页文本的中文概念知识库构建算法研究及应用

随着互联网和知识经济的发展，越来越多记载着人类各种知识的文本出现在计算机和互联网上，网络上的海量信息和知识为人们的科研、学习、工作和生活提供了丰富的资源，极大地推动了

学位

概念知识库概念知识库组合词组合词认知模式认知模式文本挖掘文本挖掘网页文本网页文本自然语言处理自然语言处理系统设计系统设计

借助网络信息的汉英实体翻译技术研究

命名实体翻译是机器翻译、跨语言信息检索等多语言信息处理领域的一项重要任务。同时，随着互联网的发展，网络资源日益丰富，如何将海量的网络资源用于命名实体翻译任务，以提高实体

学位

网络信息

操作系统可信启动研究

机密性，完整性和可用性是计算机安全追求的目标。其中机密性保证了敏感信息的访问受限于某些特殊的群体。完整性保证了信息不会被任意地篡改，体现了人们对信息的信任程度。可用

学位

操作系统可信计算计算机安全启动流程

基于MDE建模与模型转换的若干研究

如何高效、低成本地开发优质的软件产品一直是计算机软件领域重点研究的问题。模型驱动工程(MDE)被认为是软件开发技术朝此目标发展的一条新的道路。MDE的核心部分是建模和模

学位

软件开发软件移植模型转换程序语言

基于SOA的门户系统(portal)的研究与实现

ARP项目是中科院“十五”期间重点建设的科研管理信息化支撑平台。自从2006年建成并部署使用以来，该系统极大地完善了中科院科研管理和电子政务业务建设，基本上解决了中科院内

学位

管理信息

儿童网络创作平台的设计与开发

随着信息技术的发展和计算机技术的普及，互联网逐渐成为儿童生活中的一部分，但目前培养儿童创造力的网络软件很少。讲故事对提高儿童创造力起着非常大的作用，但是现有儿童网络讲

学位

儿童网络创作平台信息技术平台设计

RB模型的结构参数研究

在约束满足问题中，给定一组变元和一组约束条件，求变元的一组赋值来满足所有的约束条件。很多实际中经常遇到的NP难问题(如布尔可满足性、图着色等问题)都是约束满足问题的特例

学位

RB模型环割集树宽度结构参数约束条件

基于小麦籽粒细胞图像的病害识别方法研究

我国是一个小麦生产和消费大国，小麦是我国重要的粮食作物、商品粮品种和人民的主要口粮。小麦产量的高低将直接影响到人民的经济和生活，由于各种病害的存在严重地影响了小麦的

学位

小麦病害识别细胞图像病害图像处理

基于后缀树和LDA的检索结果聚类方法及实现

在信息全球化的今天，为了主动、快速、高效地获取自己需要的信息，人们对于搜索引擎的使用越来越频繁。当前的通用搜索引擎，对于任意查询，其检索结果都是以线性列表的形式组织展现

学位

检索结果聚类后缀树隐含主题分析搜索引擎

蛋白质翻译后修饰鉴定软件InsPecT的并行及优化研究

其他学术论文