论文部分内容阅读
本文研究对象是生命系统中具有关键作用的一类生物大分子—核糖核酸(RNA)分子,RNA的分子结构呈现出多样的变化性。其中最基本的一级结构是四种碱基(A,C,G和U)在其分子基链上的排列顺序,称为RNA序列。二级结构是RNA序列上不同的碱基在Watson-Crick和G-U规则下形成的不相交碱基对形式.在此基础上,螺旋区域和非螺旋区域相互作用,构成伪扭结结构,通过伪扭结结构,可以进一步得到RNA分子的真实三维结构。同时,伪扭结结构对RNA分子的所有生物功能都起到决定性作用,在研究自然界的RNA结构,寻找新核酸和设计人工RNA分子时,我们都希望能找到一条RNA序列,使其折叠(Fold)成某个指定的伪扭结结构,并进而分析这条序列和指定结构所导出的中立网络。这种通过给定RNA结构,得到期望的RNA序列的过程,称为RNA序列设计。目前已有的三种RNA序列设计算法,RNAinverse,RNA-SSD和INFO-RNA,都只能处理二级结构。给出一个新的RNA序列设计算法—inv,新算法能够有效地处理所有3-noncrossing的正规伪扭结结构。
本文阐述了新算法inv的设计和实现思路,并给出两类应用例子。文章还列出算法的核心伪代码,并附上详细的分析。算法的ANSIC99实现可以从http://www. combinatorics.cn/cbpc/inv.html自由获取.文章通过非平面RNA结构验证了inv能够对3-noncrossing伪扭结结构进行序列设计。另外,通过使用inv,我们估算了中立网络的距离。算法inv扩展了针对伪扭结结构的RNA序列设计的能力。与RNAinverse相比,inv引入了一些新的想法,例如考虑了竞争结构集合的概念.这些新想法不但能处理伪扭结结构,而且对于二级结构,同样能给出全新的序列。
本研究主要内容包括:第一章介绍了RNA的表示方法,生物作用,RNA结构预测和序列设计方向的一些基本概念.简要分析比较了现有算法的优缺点和异同点,进而介绍了被广泛使用的RNA热力学模型;第二章给出了算法inv的两个应用,针对非平面结构设计RNA序列和估算中立网络的距离;第三章中说明了算法inv的设计思想和实现方法;第四章对算法的性能分析比较和进一步的工作方向进行了讨论;第五章中探讨了折叠算法中使用的一些基本概念,并给出了折叠算法的总体思路。