【摘 要】
:
随着基因组计划的实施,新的分子生物信息数据大量涌现.如何从中得到有价值的知识是一项非常艰巨的任务.生物信息学就是为了满足这一要求而迅速发展起来的.在生物信息学中,对
论文部分内容阅读
随着基因组计划的实施,新的分子生物信息数据大量涌现.如何从中得到有价值的知识是一项非常艰巨的任务.生物信息学就是为了满足这一要求而迅速发展起来的.在生物信息学中,对序列数据进行相似性比较即序列比对,是一种基本的信息处理方法,它对于发现生物序列中的功能、结构和进化的信息具有非常重要的意义.而序列比对就是运用某种特定的数学模型或算法,找出两个或多个序列之间的最大匹配碱基或残基数,比对的结果对应了算法在多大程度上反映了序列之间的相似性关系以及它们的生物学特征,因此,设计一个合理高效的序列比对算法已成为生物信息学领域中的一个非常重要的研究课题.在该文中,我们主要研究多序列比对算法.该文首先介绍了生物信息学的起源、发展以及研究内容,给出了生物信息学的定义,介绍了序列数据库和序列分析中的难点.然后介绍了多序列比对的定义以及相关的概念,并概括介绍了一些多序列比对的算法,分析它们的优劣.接着重点研究了基于HMM的多序列比对.然而,一个很重要的问题是目前的HMM参数估计算法——不管是对已比对的一组序列的Viterbi算法还是对未比对的Baum-Welch算法,都只能找到局部最优比对,找到全局最优比对的训练方法是一个未解决的问题.想要揭示一组序列的相似性,如果陷入局部最优,容易得到错误的结论.所以如何避免局部最优,是HMM参数估计算法的当务之急.该文针对此算法全局最优问题提出了基于遗传算法的HMM参数估计,与已有的训练算法相比,遗传算法在搜索全局最优时具有突出的优势.从实验结果也证明这一点.
其他文献
论文根据国内外在野外地质调查数据采集技术方面的研究现状,结合我国实际和新一轮国土资源大调查的要求,基于掌上电脑、3S技术等野外地质调查信息化的新一代野外数据采集技术
随着计算机优化技术的发展,分布式遗传算法得到诸多关注,其发展非常迅速。在分布式和并行计算模式上遗传算法可以显著提高优化效率,而且提出和改进的分布式遗传算法也很多。这些
Internet革命性地把用户与分布在世界各地、以不同形式存在的信息连接起来.可是,Internet上的窨信息资源仍然面向特定领域,依赖于特定的支撑环境,他们自自独立、相对封闭、无
云计算模式下生产型重要信息系统与传统的生产型重要信息系统相比,最大的特点就是,大量分散在用户终端计算机里的数据和文件,全部集中到中央服务器集群里。用户终端计算机不实际
20世纪90年代以来,随着Internet日益走进人们的生活,人们已经不满足传统的静态图片和文本信息,更需要以音频、视频为主的多媒体数据.网络和通信技术的迅速发展使得在网络上传
随着网络带宽高速增长,宽带接入(通过ADSL、cable modem等设备)Internet越来越普遍.流媒体系统中的主要制约因素是由于网络拥塞带来的报文损失和延迟,而不是由于用户接入的物
近年来,电子商务随着网络技术的飞速发展迅速普及,它已经成为了计算机行业中研究的热点问题之一。传统的WEB语言HTML由于其不可扩展性,已经远远不能满足电子商务的动态发展了,而X
地理信息系统简称GIS(Geographical Information System)是一种决策支持系统,它具有信息系统的各种特点。地理信息系统与其他信息系统的主要区别在于其存储和处理的信息是经过地
随着通信业务的发展及通信网络规模的进一步扩大,新技术、新设备、新业务不断出现,运营商对电信设备制造厂商同时组网的产品均提出了统一网管的要求,即不同类型的产品能在同一个
随着互联网的发展,人们既感到信息资源十分丰富,又感觉想找到所需的信息相对较难.原因之一是现有的信息系统还没有能够对信息资源进行有效的组织管理,内容管理是解决此问题的