论文部分内容阅读
微生物基因组是目前完成测序最多的基因组,其基因组研究在工业生产和疾病防治上有重要意义。为了从基因组序列中提取出有生物学意义的信息,在研究中常用到比较和进化基因组学方法。本文结合中国三株鼠疫菌(Yersinia pestisD182038、D106004、Z176003)全基因组序列研究,开发新的可视化分析工具,为微生物基因组研究提供了可以借鉴的模式和方法。
本文第一部分报道了三株病原菌——鼠疫菌的全基因组测序以及与已完成测序的七株鼠疫菌基因组和假结核菌(Yersinia pseudotuberculosis IP32953)的比较分析。这三株均属于古典型菌株,本文介绍了它们染色体和质粒的基本特征、插入序列和重组情况;注释并比较了编码基因;开发了基因比较数据库,研究发生突变的基因和特有基因,为鼠疫菌的基因分型打下了基础;比较了三株毒力基因的变异情况,发现分离时的强毒株Z176003的基因型突变为Pgm-,为评估pgm基因簇在传代中的丢失和减毒疫苗的研制提供了依据;通过全基因组比较,在三株中各挑选出303、302、279个特有的突变位点,提供了鼠疫菌基因突变分型的材料;研究了四株鼠疫菌和一株假结核菌的系统发育关系,为中国鼠疫菌的分化和迁移研究提供了依据。
可视化工具在基因组研究中起到关键作用,它加速了知识的获取、概括和抽象。本文的第二部分针对微生物基因组的特点,结合鼠疫菌含大量重组片段的现象,开发了一种可以三维动态展示基因组信息的软件3D Genome Tuner。该软件解析GenBank基因数据库的注释,利用OpenGL绘制出三维环状基因组图展示给用户。3D Genome Tuner实现了多个环状基因组之间的比较,其动态的三维界面带有旋转、缩放、改变视角的功能,有利于多基因组特征的比较。3D Genome Tuner借助于JAligner API实现了基因序列的实时比对,通过调用BLAST、MUMmer、Mauve等软件,还可以建立基因或基因组间的同源联系,便于比较基因组学研究。
在鼠疫菌的进化分析中,我们发现多序列比对软件,如MEGA、CLUSTALX不能查看突变频率。为实现多序列比对的可视化分析,我们编写了MSA2SNP软件。它可以计算CLUSTAL格式的序列比对的每个位点的突变频率,进而筛选特点间隔、特点频率的突变位点,根据突变类型分类。还能查看位点的测序质量,确定突变的可信度。实际应用证明MSA2SNP适合测序数据的比对和分析。