零抽样断点距离的一个改进算法

来源 :山东大学 | 被引量 : 0次 | 上传用户:zzu123456789zzuliuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组学出现于1980年,随着几个物种基因组计划的启动,基因组学得到了很好的发展。近年来,随着各种新技术的出现,基因组学更是进一步的发展。海量的基因组数据从这些新技术中不断的出现,面对爆炸性增长的数据,我们急需要一种新方法来对这些数据进行处理,比较基因组学应运而生。比较基因组学中最重要的问题之一就是抽样断点距离问题。该问题在文献中已经被广泛的研究。抽样断点距离问题描述为:对于两个输入基因组,找到它们各自的抽样序列,使这两个抽样的断点距离最小。抽样断点距离问题的特殊版本为:两个输入基因组中每一个基因家族至多出现两次,并且判定它们是否存在断点距离是零的抽样序列,即是否能归约成相同的基因组。我们把这样的问题称为零抽样断点距离问题,简称为ZEBD(2,2)问题。Blin等人已经证明零抽样断点距离问题是NP-Hard的,并且不存在任何参数化的算法,即使每一个基因家族在一个基因组中至多出现两次。目前存在的判定ZEBD(2,2)问题的算法中,时间复杂度最好为O(n21.86121n)。在本文中,我们改进了该算法,将时间复杂度提高到了O(n21.84931n)。如果抽样图中每一个基因家族构成的子图至多有两条边,可以在多项式时间内判定出这两个基因组是否存在断点距离为零的抽样。我们算法首先就是把两个输入基因组构成的抽样图经过处理,使其满足每一个基因家族构成的子图至多有两条边。我们通过穷举达到这样的目的。我们算法就是通过减少穷举的次数,提高了时间复杂度。具体方法为:我们同时分析两个基因家族构成的复杂分支对,将它们分解成每一个基因家族只含两条边的子图,分支对至多能分解出三个这样的子图;然后,将满足一定条件的分支对,再添加一个基因家族构成分支Triple,并对这个分支Triple进行分解,分支Triple最多能分解出五个子图。经过这样的处理,使得分支对的分解个数由原来的4个减少到3个,分支Triple的分解个数由原来的8个减少到5个。因此降低了算法的时间复杂度。
其他文献
随着计算机技术,通信技术和电子技术的大力发展,人类社会已经进入了数字化时代。多媒体技术的数字化使得人们的生活变得更加丰富多彩。视频压缩又是数字多媒体技术的核心技术
会话初始化协议(SIP)是由IETF提出的信令协议,近年来发展成为下一代网络(NGN)和3G中的核心协议之一。本文研究的内容是SIP的安全性问题。文中首先对SIP进行了介绍,并详细讨论
中国自主知识产权的TD-SCDMA无线移动网络已在国内部分城市大规模建设,网络规划优化质量影响到网络建设的成本和运营性能,而网络规划优化软件的优劣与网络规划优化质量息息相
ALPHA-STABLE分布在现实生活中大量存在,目前它是国际上研究比较热门的课题之一,由于ALPHA-STABLE分布很好的描述了现实世界中数据的分布,它逐渐被应用到各种领域,性质也越来
色彩管理技术近几年得到迅猛发展,分光测色仪则是色彩管理中不可或缺的高精度颜色测量设备。目前,动态分光测色仪技术还存在测量速度慢、成本高、与现有先进技术脱节等缺陷,
Web Service技术是目前企业应用集成领域的主流技术。它提供一种一致编程模型,从而在企业信息系统内外都可以利用通用的基础设施,并可采用通用的、增量的方式进行应用程序集成
随着多媒体技术和CG技术的发展,渲染引擎在电影动画、模拟仿真、游戏特效等方面具有越来越广泛的应用。主流渲染引擎无一例外都非常重视光线追踪算法在渲染系统中的重要作用,
无线传感器网络WSN(Wireless Sensor Networks)是继因特网之后,将对二十一世纪人类生活方式产生重大影响的IT热点技术,在军事、工业、民用等领域有巨大的应用价值和前景。无
随着图像、视频生成工具的不断普及,图像、视频的数量呈现爆炸式增长,单纯的依靠人力获取图像、视频中的信息已经不能满足实际的需求。近年来人们对图像以及视频的智能分析、
基于协同进化的自动谈判研究是多主体系统、协同进化学习算法和电子商务自动谈判研究的交叉点,是目前分布式人工智能和智能计算等领域的新兴研究课题。作为解决现有AMEC系统中