论文部分内容阅读
蛋白质的合成是所有生物体中的基本生命过程。核糖体维持正确的读框对于蛋白质的合成至关重要,一旦发生移码,将会导致截短的或无义蛋白的生成,从而造成翻译能量的损耗,加重细胞清除及质控机制的负担。然而,在某些特殊情况下,翻译中的核糖体能够在mRNA的特定位置,从起始的0读框转换到-1或+1读框,然后继续进行翻译,这一过程被称作编程性核糖体移码(programmed ribosomal frameshifting,PRF)。PRF现象首次在病毒中发现,随后越来越多的证据表明该现象普遍存在于从细菌到真核生物等生命进化的各个分支。前期基于单个基因的研究显示游仆虫中具有高频率的+1PRF现象。本研究对八肋游仆虫(Euplotes octocarinatus)的大核基因组及转录组进行了测序分析,从基因组水平对这一特殊现象及其分子机制进行了深入探讨。此外,还通过质谱分析对预测的PRF基因加以验证。所得结果如下: 1.利用Illumina测序平台对八肋游仆虫大核基因组进行测序,共得到约11Gb原始数据;将低质量reads过滤后,采用meta-assembly的拼接策略进行基因组组装,将组装结果中来自于细菌基因组及线粒体基因组的污染DNA去除后,最终得到41,980条Contigs,其N50为2,947bp,其中包含双端端粒的Contigs有29,413条;随后采用三种方法对拼接结果的完整性进行评估,结果表明拼接结果基本完整,八肋游仆虫大核基因组能够编码细胞营养生长阶段所需的全部基因;最后,利用AUGUSTUS软件对大核基因组中的non-PRF Contigs进行基因的从头预测,共预测出29,076个完整基因,其中90%的基因有RNA-Seq数据的支持。对每条微染色体所包含的基因个数进行了统计,结果显示约83%的微染色体仅编码一个基因;与其他纤毛虫一样,八肋游仆虫非编码区的AT含量比编码区高。 2.利用二代测序技术,对生长阶段的八肋游仆虫转录组进行测序,共得到4.9Gb数据。采用两种方法对转录组数据进行组装,比较后选择Tophat&Cufflinks的组装结果进行后续分析,该方法共拼接出32,353条转录本,平均长度为1,300bp;基于转录组数据,采用相似性搜索的策略,最终共预测出4,690个移码位点,分布于3,866个编程性核糖体移码基因中,其中+1PRF基因3,700个,+2/-1PRF基因166个。随后通过跟其他游仆虫进行同源序列比对,共鉴定出5个-1PRF基因;对移码基因进行了Pfam结构域注释,KEGG信号通路注释及GO功能注释,注释结果显示游仆虫中PRF基因功能多样,分布于多个信号通路及生物过程;利用GO信息,对移码基因进行了功能富集分析,结果表明移码基因显著富集于多个生物过程,主要涉及到磷酸化、去磷酸化及依赖泛素的蛋白降解等过程。 3.对八肋游仆虫的总蛋白进行了大规模质谱分析,最终得到2,853种蛋白的肽段信息,其中253种为PRF蛋白;移码位点被肽段覆盖的基因有7个,全部为+1PRF基因,其中CUFF.27536.1的两个+1位移码位点均有肽段覆盖。根据移码位点肽段的氨基酸序列信息,确定了游仆虫中+1PRF基因的移码发生在滑动序列中终止密码子TAR(R=A or G)的T处;此外还有89个PRF基因的移码位点上下游均有肽段覆盖,包括82个+1PRF基因以及7个+2PRF基因,这些肽段为证明游仆虫中的PRF现象提供了间接的蛋白证据;根据肽段信息,结合多序列比对结果,我们推测八肋游仆虫的+2位移码过程中,核糖体跳过了滑动序列中终止密码子TAR的TA两个核苷酸。 4.对所有PRF基因移码位点上下游30bp的序列进行保守序列模体的分析,结果发现除滑动序列外,无其他保守序列元件;对滑动序列的分析结果显示,约92%的移码位点由AAA密码子和紧随其后的终止密码子组成,其余8%由其他密码子和终止密码子构成,移码位点共包含47种有义密码子;在+1PRF基因的滑动序列中XXX(三个核苷酸相同)类型的密码子最多(97%),而在+2PRF基因的滑动序列中XTA(X代表任意核苷酸)类型的密码子最多(73%),5个-1PRF基因中,有3个基因的滑动序列为AAG TAA,其余两个分别为TCT TAA和TTT TAA,其滑动序列下游未检测到假结或茎环等刺激结构;此外,对八肋游仆虫中正常翻译终止位点及移码位点中终止密码子及四核苷酸序列的使用频率进行了比较,结果显示UAA和UAA-A在正常翻译终止位点和移码位点中都是优先使用的,但移码位点中UAA及UAA-A的使用频率要显著高于正常翻译终止位点。这些结果说明在游仆虫中,终止密码子UAA及四核苷酸序列UAA-A可能更有利于移码的发生。八肋游仆虫大核基因组中含有12种反密码子环扩大的特殊tRNAs,对其核酸序列进行分析结果表明这些tRNAs含有保守的基因内启动子,TATA-box以及终止信号。随后对八肋游仆虫的small RNA进行了高通量测序,结果表明除Contig34792外,其他特殊tRNAs均具有转录活性。 5.基于核酸序列信息,共鉴定出23个包含读框内终止密码子的基因。对其中编码组织蛋白酶B的基因进行了序列分析及同源序列比对,结果显示,在八肋游仆虫中,UAA和UAG既可作为终止密码子,又可以编码氨基酸;质谱分析检测到AMP结合酶家族蛋白的三条肽段,证明在八肋游仆虫体内,含有读框内终止密码子的基因能够翻译出有功能的蛋白产物。 6.建立了八肋游仆虫基因组数据库(Euplotes octocarinatus Genome Database,EOGD,http://ciliates.ihb.ac.cn/database/species/eo),该数据库整合了本研究测得的八肋游仆虫大核基因组数据、转录组数据、预测基因的注释信息以及关于八肋游仆虫分类和形态的描述信息。该数据库设计了多种简单易用的搜索方式,包括Gene ID、scaffold ID、关键词、基因的序列及位置信息等,使研究人员能够轻松获取游仆虫基因组及转录组数据。EOGD的建立为在游仆虫中开展相关研究提供了极大的便利。