【摘 要】
:
生物信息学是研究对生物数据进行获取、存储、分析等多个方面的一门综合性学科,是生命科学研究的重要组成部分。基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物
论文部分内容阅读
生物信息学是研究对生物数据进行获取、存储、分析等多个方面的一门综合性学科,是生命科学研究的重要组成部分。基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物的基因组都不可能在实验中一次性测得,需要利用序列拼接技术对实验中获得的零散的DNA片段进行拼接操作。 当前的序列拼接算法主要有两类:基于Hamilton路径的拼接算法和基于Euler路径的拼接算法。基于Hamilton路径的算法会导致NP-完全问题,具有过高的时间复杂度;基于Euler路径的拼接算法把DNA序列拼接问题转化为在de Bruijn图中寻找 Euler路径的问题,存在线性时间算法,但需要的存储空间较Hamilton路径算法多。 随着测序技术的发展,测序过程中获得的DNA片段越来越短,基于Euler路径的拼接算法在处理这种短片段拼接时更具优势,是目前序列拼接的重要研究方向。在Euler路径算法中,一个关键步骤是de Bruijn图的构建,一直以来,构建de Bruijn图的方式都没有改变过,总是让后一个k-mer与前一个k-mer之间有 k-1个碱基的交叠,相邻的两个 k-mer之间相互错开一位。但本文的研究发现,如果让有边连接的两个 k-mer之间相互错开两位或者更多位数的碱基,使他们之间有k-2个或者更少的碱基相交叠,会对de Bruijn图结构的复杂性产生重要影响。本文针对这些影响进行详细分析,并设计了一个可以对错位数与de Bruijn图结构关联性信息进行查询的系统。系统运行结果表明,k-mer之间的错位数变化对de Bruijn图结构复杂性确有显著影响,已有的算法如能考虑到错位数的影响,选择合适的错位数来构建结构更加简单的de Bruijn图,并在拼接算法中考虑错位数因素,会得到更好的拼接效果。
其他文献
三维重建是计算机视觉研究的核心问题之一,三维重建目的是通过物体的二维图像信息恢复物体的空间三维几何形状,主要步骤包括:特征点检测与匹配,空间约束矩阵的求解,摄像机内
随着零售业信息化的不断发展,企业管理者逐渐认识到关联规则有很大的应用价值,可以为企业带来巨大的经济利益,于是关联规则挖掘更加备受关注。 课题在对目前国内外关联规则算
随着信息技术的不断提高,矿山企业正步入信息化、自动化和智能化的发展历程。但是由于我国矿山企业信息化基础较薄弱,矿山企业资源调度信息化的程度整体上还比较低,基本上处于起
BitTorrent(简称BT)是当今互联网上最为流行的P2P文件共享系统之一,其匿名性、开放性以及高效性赢得了越来越多用户的青睐,BT客户端也得到了日益广泛的应用,仅在2004年,BT流
随着移动计算、无线通信技术的快速发展和无线通信设备的普遍应用,无线移动环境下的网络研究和应用引起了研究者的广泛关注,其中延迟容忍网络,由于其对网络延迟和中断的一定
不同的生物认证特征包括:人脸、指纹、掌纹、虹膜、击键、签名和声音等,最近的研究已经证实虹膜是其中最精确和可靠的生物认证特征。因此,作为基于虹膜特征的身份认证过程,虹膜识
多目标跟踪是计算机视觉研究领域一个重要的组成部分。在军事,医疗,安防,人机智能交互等方面有着广泛的应用。基于特征多目标跟踪技术包括对视频序列的目标检测分离、分析提
P2P即点对点网络,是互联网应用领域中的热门技术。P2P由于取消了服务器的概念,使得网络中的用户可以直接的进行资源传输,P2P资源共享技术作为P2P的重要应用领域之一也受到了互联
随着室外视频监控系统的广泛应用,面对海量的实时视频数据,人们不仅需要有效管理,还需要能够实时自动从中提取出运动目标的信息,实现室外监控视频系统的智能化。行人异常行为
在无线传感器网络(Wireless Sensor Network,WSN)中,定位技术使网络能够确定各个节点的坐标,从而确定事件发生的位置,使网络做出有效地行动,是WSN核心技术之一。其中,基于测