DNA序列的Motif识别随机算法

来源 :北京大学 | 被引量 : 0次 | 上传用户:cnfjwbx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Motif是在多个序列中(近似)出现的一个短串。DNA序列的motif识别在生物学研究中有很多应用。本文提出一种用于motif识别的随机算法,并且对其进行性能改进,最后形成一个可用的软件。 本文包含以下工作:(1)为consensuspattern问题设计了一个随机算法,并且证明了:给定误差范围£,在用户指定的1-δ概率下,我们的算法可以在多项式时间内找到一个位于误差范围内的pattern。(2)我们将该算法与EM(ExpectationMaximization)算法结合,并对算法作出改进,性能提高很多。我们根据改进后的算法设计了一个motif识别软件,该软件在处理真实DNA数据时,能够同时找到多个motif。(3)我们将该软件与Projection(目前最好的motif识别程序)作了性能对比,结果表明,在较短的motif上我们的程序不如Projection速度快,但在识别较长、较难的motif时我们的程序具有更好的准确度和速度。
其他文献
随着Internet/Intranet技术的发展和普及,计算机化考试在许多方面将逐步取代传统的基于纸笔的考试。探讨和研究基于网络的考试系统,以便能客观、准确地评估学生的能力和水平,
在数据流应用中,数据流是连续、无界、快速、时变的,而系统环境、查询负载等随时都会产生大量的变化,如何为一组查询寻找一个最优的查询计划由静态变成了动态,这使得数据流管理系
在商业经济贸易活动中,发展大客户会给运营商带来很好的经济效益。根据公认的二八原则,运营商收益的80﹪来自20﹪的大客户,因此各大运营商比以往更加重视大客户在企业营收中的作用。
一个图书馆的好坏关键取决于该馆图书利用率的高低。目前,提高图书利用率的问题已经越来越引起人们的广泛注意,为了解决该问题,目前已有很多文献从多方面提出了有价值的建议,
随着信息技术的飞速发展,作为数字地球的重要支撑技术之一的元数据技术显得越来越重要。空间元数据描述了地理信息中空间数据集的内容、质量、表示方式、空间参考、管理方式以
随着计算机和网络技术的发展,越来越多的功能被实现。C/S,B/S结构的系统目前虽然已经非常成熟,但在可维护性、扩展性和效率的提高上已经难已满足发展的需要,而multi-tiers构架系
GIS是GeographicInformationSystem(地理信息系统)的简称,是为特定应用目标建立的空间信息系统,是在计算机硬件、软件及网络支持下,对有关空间数据进行预处理、输入、存贮、查询
本文围绕Web服务自动测试技术展开了研究。首先对现有的Web服务测试技术进行分析,结合Web服务自动化测试的需求,提出提高Web服务测试自动化程度需要解决的问题:一,需要以较低的代
在现今局域网、广域网的系统中,大量使用中间件成为主流趋势之一,随之而来的各种基于中间件的开发也渐渐的热起来。中间件是一种独立的系统软件或服务程序。中间件位于客户机/
学位
随着互联网络的迅速发展,网络攻击技术也变得复杂而又巧妙,网络攻击事件的数量每年都在大幅度上升。入侵检测技术是现代网络安全模型中的关键环节,然而入侵检测技术面临着网络复