论文部分内容阅读
随着测序技术的不断发展,目前已经获得了大约20多种昆虫的全基因组和大约100多种昆虫的线粒体基因组序列。然而单纯获取全基因组序列已经不能满足科学研究的需求,要求研究人员对已知基因组序列进行深入分析和研究,进而挖掘其中隐含的生物学和物种进化信息。现在数据库中的基因序列呈指数级增加,相应的分析工具也是与日俱增,这为生物学工作者提供了极大的方便。昆虫属于节肢动物门、六足总纲、昆虫纲,是地球上已知种群数目最多的一个类群。昆虫学的研究对于维持地球生态平衡、促进可持续发展、防治农业和林业病虫害具有极其重要的作用。在昆虫细胞内主要有两个基因组,核基因组和线粒体基因组。核基因组具有较多的非编码区、重复序列、内含子以及大量的重排现象,不同的物种间具有比较大的差异;线粒体基因组的组成则在同一个动物门中具有较高的保守性,一般情况下是一个双链闭合环状结构,它包含13个蛋白编码基因,2个核糖RNA(rRNA)的编码基因以及22个转运RNA(tRNA)的编码基因。此外,在大多数昆虫细胞内寄生着一种内共生菌Wolbachia,它是一种革兰氏阴性alpha-蛋白菌,它主要感染节肢动物和丝虫。它可以通过诱导孤雌生殖、雄性雌性化、杀雄以及精卵不相容等生殖操纵而改变寄主的生物学特性。本研究将使用对应分析、卡方检验和似然比检验等生物信息学的方法来检测昆虫中所包含的核基因组、线粒体基因组和Wolbachia核基因组的密码子使用偏好性、密码子进化趋势以及各个基因组之间密码子使用的相关度。线粒体基因所编码的蛋白对于维持生物体的生命活动具有重要意义。故本研究对昆虫线粒体基因组的密码子组成和tRNA分子的使用情况进行了统计分析。结果表明,在昆虫线粒体基因组中,有10种最优密码子与对应tRNA分子上的反密码子不能完全匹配。这一结果与哺乳动物、鱼类以及真菌的线粒体基因组中密码子使用情况是不同的。故推测昆虫线粒体基因组中的密码子使用没有受到tRNA丰度的影响,它们是独立于tRNA分子的丰度进化而来的,并且这种不匹配的现象在昆虫线粒体基因组中是普遍存在的,其机理还有待于进一步的研究。线粒体基因所编码的蛋白不能单独起作用,它需要核基因所编码的蛋白共同组成细胞内电子传递链上的复合体来参与完成氧化磷酸化过程。氧化磷酸化过程是细胞中唯一一个同时有核基因和线粒体基因共同参与的过程,它们之间存在着协同进化关系。本研究以黑腹果蝇(Drosophila melanogaster)为对象,探讨参与氧化磷酸化过程的核基因以及线粒体基因的密码子组成情况。研究结果显示黑腹果蝇氧化磷酸化系统中核基因的密码子组成主要受到翻译选择和基因组碱基组成的影响;而线粒体基因的密码子组成,通过对应分析并没有发现主要影响因素,可能和细胞器的起源有关,并不受到功能的限制。尽管黑腹果蝇氧化磷酸化系统中的核基因和线粒体基因具有相关的功能并且彼此之间是协同进化的,但它们具有明显不同的密码子使用模式,因此这种协同进化作用主要是通过基因所编码蛋白的三级结构体现出来的。通过统计检验表明,核基因和线粒体基因的密码子组成都受到了碱基关联突变(context-dependent mutation)的影响。除核基因组和线粒体基因组之外,昆虫细胞内可能还包含胞内共生菌Wolbachia的基因组。由于Wolbachia的基因组和昆虫的线粒体基因组具有较高的相似度,如共同的祖先alpha-蛋白菌,以及母系遗传的特点,故可能从Wolbachia核基因组和昆虫线粒体基因组的密码子组成或基因组组成的方面来进一步寻找它们共同起源的证据。本研究以黑腹果蝇中的专性胞内寄生菌Wolbachia pipientis wMel为研究对象,分析表明Wolbachia pipientis wMel基因组具有较高的AT碱基含量,并且不管是高表达基因还是低表达基因都倾向于使用富含AT的密码子。Nc-plot结果显示基因组碱基组成可能是影响密码子组成的因素。对应分析显示基因组中的密码子组成还可能受到基因长度和基因表达水平的影响。Wolbachia pipientis wMel作为革兰氏阴性alpha蛋白菌,它的基因组与动物线粒体基因组具有的相似之处,如较高的AT碱基含量,可以进一步印证Wolbachia和线粒体之间的密切关系。以上分析过程中,本研究选用了一个重要参数:CAI (codon adaptation index),该参数尽管存在一定的争议,却具有比较大的用途。在刚测出全序列的基因组中,有些基因的表达水平通过实验验证比较费时间,且成本比较高,那么就可以使用CAI值来估计一些未知基因的表达水平高低。CAI值我们称为密码子适应指数,它的变化范围位于0到1.0之间。它的值越高意味着具有较高的密码子偏好性,以及较高的表达水平。目前,有10条果蝇的全基因组被成功测序,为生物学研究提供了足够的数据支持。本研究下载了7种果蝇中与侵略性(Aggressive)相关的基因CYP6A20,通过比较这7种果蝇的CYP6A20基因的CAI值,本文对这7种果蝇的侵略性水平进行了推测。需要声明的是,由于缺少行为学的直接证据,且CAI值的计算也存在偏差,结果可能会出现误差,但是CAI值在后基因组时代的应用会越来越广泛。基于密码子水平上的选择压力分析对于研究基因进化具有重要作用。本研究讨论了昆虫细胞色素氧化酶亚基I (COI)的适应性进化。昆虫作为地球上最大的一个类群,尽管同一个动物门中的线粒体基因组比较保守,但是它们在序列上还是有明显的不同。随着后基因组时代的到来,有越来越多的昆虫线粒体基因组被测序,这为研究昆虫中COI基因的系统进化提供了新的角度。通过对31条昆虫线粒体中蛋白编码基因COI的分析,表明COI基因受到了较强的净化选择压力。但是昆虫所面临的生存压力在不同的物种中是不同的,COI基因自身必须发生进化以适应各自的环境压力。通过PAML 4.0中的codeml程序以及三对模型进行选择压力分析,只在Model 7 & Model 8的比较中,检测到了12个受到正选择压力的氨基酸位点,但只有第395个位点受到了显著的正选择压力,其余11个位点没有受到明显的正选择压力。这一结论和以前关于线粒体基因的进化特点是吻合的,从另一个角度也验证了线粒体基因的保守。