论文部分内容阅读
广泛存在的微生物对自然界的发展起到了重要作用,也与人类社会的工业过程密切相关。因此,微生物的研究对地球生态系统和人类自身都具有重要意义。早期对微生物的研究主要依赖于实验室的提纯培养技术,但这种方法存在很大的局限性,因为在现有的实验室提纯培养条件下,有约99%的微生物无法进行提纯培养,并且实验环境与微生物的实际生存环境可能有各方面的差别,这可能会给实验培养条件下进行的生物学研究带来较大的误差。为了避免传统方法中实验室培养技术的限制,近十几年来逐渐发展出了宏基因组学研究方法。这是一种把环境样品中的微生物群体基因组作为研究对象,以不进行提纯培养直接测序分析为研究手段,对微生物多样性、种群结构、进化关系、相互协作关系以及与环境之间的关系等问题作为研究目的的新的微生物研究方法。由于宏基因组为研究微生物带来的巨大机遇,相关方面的研究目前已经成为研究的重要热点。 我们选择了两个典型的宏基因组数据作为研究对象,即酸矿水微生物群落和夏威夷海微生物群落宏基因组。其中,酸矿水微生物群落物种组成较简单,且已经拼接出主要微生物的接近完整的基因组。我们首先对酸矿水各物种基因组进行了基因预测和翻译起始位点修正,得到一套新的基因注释,随后进行了一系列基因组分析。我们选择了与酸矿水微生物进化关系最近的五个培养菌株,并由16SrRNA和23S rRNA得到了所有研究物种的系统发育树。其中,F.acidarmanus和plasma系列物种的分类关系更新了已有结果,也得到序列分析结果的进一步验证。同时,我们分析了微生物翻译起始密码子和基因上游信号的使用情况。和所选择培养菌株的比较结果显示,酸矿水环境中的微生物与实验室培养菌株在翻译起始机制上有明显差别,前者更多的使用leaderless翻译起始机制以及目前了解不明确的其他翻译起始机制;翻译起始密码子上,酸矿水基因组ATG的使用率低于实验室培养基因组,这可能意味着ATG作为起始密码子的优势在野生环境即微生物群落中并没有实验室单独培养环境中明显。此外,我们还统计了酸矿水物种基因组编码区氨基酸及密码子的使用偏好并分析了可能的原因。 夏威夷海微生物群落比酸矿环境物种复杂度高很多,且包含七个不同深度的样本。我们统计了每个深度样本基因组的基本信息,在对各个深度的基因组进行基因注释和翻译起始位点修正后,得到完整的基因注释。随后,我们将预测出的基因对KO数据库做了同源比对,得到基因的功能注释。其中,约50%-60%的基因得到了匹配结果,说明海洋微生物有很多新基因,并且可能存在着很多新物种。之后,我们结合几个样本的环境特点,包括光照强度、溶氧量及深渊高压低温,通过统计相关代谢通路的基因拷贝数,分析了相应样本中微生物代谢的适应性表现,从分子层面验证了所处环境对微生物基因组的影响。这些分析从序列本身出发,涉及了具体的代谢过程,能够指导类似环境因素影响研究的实验工作。 总体来说,本文采用了一系列生物信息学工具和方法,以宏基因组序列信息为基础,对酸矿水环境和夏威夷海两个典型的宏基因组数据分别采用不同的策略进行了系统的研究和比较分析,包括翻译起始机制、密码子和氨基酸的使用偏好、环境基因组和实验室培养基因组的差别,以及环境因素对微生物代谢表达的具体影响等。这些研究结果为后续工作和生物学实验提供了依据和线索,也充分表明了生物信息学手段用于实际生物学问题的重要意义。