论文部分内容阅读
揭示生物的适应过程及其背后的遗传基础,是当前进化生物学研究的一个主要目标。生活在极端环境中的物种,其通常都衍生出了一系列独特的生理或行为特征来适应环境,因此适宜作为研究适应性进化的对象。尽管在基因组水平对模式生物的研究取得了一系列丰硕的成果,但在更多的非模式生物自然种群的研究中,缺少组学水平的全面分析。近来,高通量测序技术和生物信息学的发展使生物科学进入了大数据时代,也为更深入地研究这些非模式生物提供了方便。 高海拔地区由于其低氧、低温、干燥和强紫外等极端环境特征,成为研究生物适应性进化的热点。近期通过对高原生物的研究,发现了一系列可能在高海拔适应过程中起作用的基因及相关通路。然而,几乎所有的组学水平研究都是针对内温动物的,很少涉及外温动物。外温动物是生物多样性的重要组成部分,与内温动物相比,它们在身体结构、生理和行为方面存在巨大差异,这也使得它们可能有截然不同的机制去适应高海拔环境。因此,对外温动物高海拔适应遗传基础的研究,就显得尤为重要。 本论文从这一科学问题入手,针对陆生外温动物的两大主要类群—两栖动物和爬行动物,通过RNA-seq技术获取研究对象的大部分编码基因序列,再通过系统学方法、种群遗传学方法和基因表达谱技术分析其序列层面、种群层面和表达层面的自然选择、趋同/平行进化以及基因表达差异。拟通过多层次大数据的整合分析,发现与两栖动物和爬行动物高海拔适应相关的基因、通路和代谢网络,为研究外温动物高海拔适应提供遗传证据。其主要研究结果如下: (1)两栖动物高海拔适应的遗传基础 本研究以高海拔两栖类高原林蛙和中华蟾蜍为研究对象,通过RNA-seq测定它们以及两个低海拔近亲中国林蛙和低海拔中华蟾蜍的转录组,得到66M-133M的原始序列;经过多个K-mer和Coverage相组合转录组的重头组装,得到了其大部分的编码基因序列。 经过重建系统进化关系及基于系统学的中性检验方法检测,在高原林蛙和高海拔蟾蜍中分别找到了33个和29个正选择基因,功能分析显示,两个物种的正选择基因均富集于生物的营养代谢,特别是脂代谢的过程,暗示它们在营养代谢方面均发生了适应性进化。 经过对两个高海拔物种的趋同/平行进化分析,发现10个带有显著平行进化位点的基因。此外,一个与心脏收缩功能密切相关的基因MYBPC2被发现发生强烈的平行进化,进一步分析显示这个基因的基因树由于非同义变异的积累发生了拓扑结构的偏离。这个基因的发现暗示心脏收缩相关功能也发生了相应的进化。 针对更适宜研究的中华蟾蜍作为研究对象,基于RNA-seq的数据,通过开发SNP位点进一步鉴定了89个候选基因的101个SNP位点。对两个独立进化方向上的5个种群进行分析,发现2个SNP位点表现为Fst异常值,其进化模式为受到平衡选择。 为了研究相关基因的表达模式,本研究进一步开展了对高低海拔蟾蜍个体的移植实验,并对肝脏、心脏和脑的基因表达谱进行了测序。在各器官组织中,心脏出现了较多的与适应和可塑性都相关的基因差异表达,但后者的影响更大。功能与代谢网络分析发现心脏中与适应相关的差异表达基因大多集中于心肌收缩的相关功能,而与可塑性相关的差异表达基因更多集中于能量代谢的过程,重要通路的分析表明高海拔个体的心脏功能减弱,暗示高海拔个体的代谢速率被放缓以适应高原极端环境。 (2)沙蜥属高海拔物种正选择基因格局研究 本研究以包含青海沙蜥和西藏沙蜥两个高海拔物种的六个沙蜥属物种为研究对象,通过RNA-seq技术测定其转录组,获得其大部分编码基因序列,并通过基于系统学的中性检验,鉴定两个高海拔物种及相关支系的正选择基因格局。 经过分析,发现青海沙蜥、西藏沙蜥、其最近共同祖先及整个高原沙蜥进化枝的正选择基因数量分别为69、60、19和82个。通过功能分析,发现这些正选择基因富集于糖代谢的过程。进一步的分析发现正选择基因富集于胰岛素信号通路中与血糖稳态相关的部分,表明高海拔沙蜥在与糖代谢的功能上发生了适应性进化。对两种高海拔沙蜥进行比较,发现西藏沙蜥的正选择基因更多富集于基因表达调控和组蛋白修饰相关功能,更暗示了西藏沙蜥在表达调控和表观遗传方面发生了进化。 综上所述,通过对两栖动物和爬行动物多层次大数据的整合分析,发现了一系列可能与其高海拔适应相关的基因、通路和代谢网络,为研究外温动物高海拔适应的遗传基础提供了证据。